home *** CD-ROM | disk | FTP | other *** search
/ Internet E-Mail Workshop / Internet E-Mail Workshop.iso / info / audio_fm. < prev    next >
Text File  |  1993-11-24  |  93KB  |  2,233 lines

  1.  
  2. Archive-name: audio-fmts/part1
  3. Submitted-by: Guido van Rossum <guido@cwi.nl>
  4. Version: 3.02
  5. Last-modified: 11-May-1993
  6.  
  7. FAQ: Audio File Formats
  8. =======================
  9.  
  10. Table of contents
  11. -----------------
  12.  
  13. Introduction
  14. Device characteristics
  15. Popular sampling rates
  16. Compression schemes
  17. Current hardware
  18. File formats
  19. File conversions
  20. Playing audio files on UNIX
  21. Playing audio files on micros
  22. The Sound Site Newsletter
  23. Posting sounds
  24.  
  25. Appendices (in part 2):
  26.  
  27. FTP access for non-internet sites
  28. AIFF Format (Audio IFF)
  29. The NeXT/Sun audio file format
  30. IFF/8SVX Format
  31. Playing sound on a PC
  32. The EA-IFF-85 documentation
  33. US Federal Standard 1016 availability
  34. Creative Voice (VOC) file format
  35. RIFF WAVE (.WAV) file format
  36. U-LAW and A-LAW definitions
  37. AVR File Format
  38. The Amiga MOD Format
  39.   
  40.  
  41. Introduction
  42. ------------
  43.  
  44. This is version 3 of this FAQ, which I started in November 1991 under
  45. the name "The audio formats guide".  I bumped the major version number
  46. again at the occasion of the split in two parts: part one is the main
  47. text and part two consists of the collection of appendices.
  48.  
  49. I am posting this about once a fortnight, either unchanged (just to
  50. inform new readers), or updated (if I learn more or when new hardware
  51. or software becomes popular).  I post to alt.binaries.sounds.{misc,d}
  52. and to comp.dsp, for maximal coverage of people interested in audio,
  53. and to {news,comp}.answers, for easy reference.
  54.  
  55. The entire FAQ is also available by anonymous ftp from ftp.cwi.nl
  56. [192.16.184.180], directory pub/audio, files AudioFormats.{part1,part2}.
  57.  
  58. A companion posting with subject "Changes to: ..." is occasionally
  59. posted listing the diffs between a new version and the last.  This is
  60. not reposted, and it is suppressed when the diffs are bigger than the
  61. new version.
  62.  
  63. This FAQ is also available in distributed hypertext form.  If you have
  64. a WWW browser and direct Internet access you can point it to
  65. "http://voorn.cwi.nl/audio-formats/a00.html".  (WWW is the CERN
  66. World-Wide Web initiative; for more info, telnet or ftp to
  67. info.cern.ch.)  You can also ftp the files from ftp.cwi.nl, directory
  68. /pub/www/audio-formats/.   This may sometimes be somewhat out
  69. of sync with the posted version of the FAQ.
  70.  
  71. Send updates, comments and questions to <guido@cwi.nl>.  I'd like to
  72. thank everyone who sent updates in the past.
  73.  
  74. --Guido van Rossum, CWI, Amsterdam <guido@cwi.nl>
  75.  
  76.  
  77. Device characteristics
  78. ----------------------
  79.  
  80. In this text, I will only use the term "sample" to refer to a single
  81. output value from an A/D converter, i.e., a small integer number
  82. (usually 8 or 16 bits).
  83.  
  84. Audio data is characterized by the following parameters, which
  85. correspond to settings of the A/D converter when the data was
  86. recorded.  Naturally, the same settings must be used to play the data.
  87.  
  88. - sampling rate (in samples per second), e.g. 8000 or 44100
  89.  
  90. - number of bits per sample, e.g. 8 or 16
  91.  
  92. - number of channels (1 for mono, 2 for stereo, etc.)
  93.  
  94. Approximate sampling rates are often quoted in Hz or kHz ([kilo-]
  95. Hertz), however, the politically correct term is samples per second
  96. (samples/sec).  Sampling rates are always measured per channel, so for
  97. stereo data recorded at 8000 samples/sec, there are actually 16000
  98. samples in a second.  I will sometimes write 8 k as a shorthand for
  99. 8000 samples/sec.
  100.  
  101. Multi-channel samples are generally interleaved on a frame-by-frame
  102. basis: if there are N channels, the data is a sequence of frames,
  103. where each frame contains N samples, one from each channel.  (Thus,
  104. the sampling rate is really the number of *frames* per second.)  For
  105. stereo, the left channel usually comes first.
  106.  
  107. The specification of the number of bits for U-LAW (pronounced mu-law
  108. -- the u really stands for the Greek letter mu) samples is somewhat
  109. problematic.  These samples are logarithmically encoded in 8 bits,
  110. like a tiny floating point number; however, their dynamic range is
  111. that of 14 bit linear data.  Source for converting to/from U-LAW
  112. (written by Jef Poskanzer) is distributed as part of the SOX package
  113. mentioned below; it can easily be ripped apart to serve in other
  114. applications.  The official definition is the CCITT standard G.711.
  115.  
  116. There exists another encoding similar to U-LAW, called A-LAW, which
  117. is used as a European telephony standard.  There is less support for
  118. it in UNIX workstations.
  119.  
  120. (See the Appendix for some formulae describing U-LAW and A-LAW.)
  121.  
  122.  
  123. Popular sampling rates
  124. ----------------------
  125.  
  126. Some sampling rates are more popular than others, for various reasons.
  127. Some recording hardware is restricted to (approximations of) some of
  128. these rates, some playback hardware has direct support for some.  The
  129. popularity of divisors of common rates can be explained by the
  130. simplicity of clock frequency dividing circuits :-).
  131.  
  132. Samples/sec     Description
  133.  
  134. 5500            One fourth of the Mac sampling rate (rarely seen).
  135.  
  136. 7333            One third of the Mac sampling rate (rarely seen).
  137.  
  138. 8000            Exactly 8000 samples/sec is a telephony standard that
  139.                 goes together with U-LAW (and also A-LAW) encoding.
  140.                 Some systems use an slightly different rate; in
  141.                 particular, the NeXT workstation uses 8012.8210513,
  142.                 apparently the rate used by Telco CODECs.
  143.  
  144. 11 k            Either 11025, a quarter of the CD sampling rate,
  145.                 or half the Mac sampling rate (perhaps the most
  146.                 popular rate on the Mac).
  147.  
  148. 16000           Used by, e.g. the G.722 compression standard.
  149.  
  150. 18.9 k          CD-ROM/XA standard.
  151.  
  152. 22 k            Either 22050, half the CD sampling rate, or the Mac
  153.                 rate; the latter is precisely 22254.545454545454 but
  154.                 usually misquoted as 22000.  (Historical note:
  155.                 22254.5454... was the horizontal scan rate of the
  156.                 original 128k Mac.)
  157.  
  158. 32000           Used in digital radio, NICAM (Nearly-Instantaneous
  159.                 Companded Audio Multiplex [IBA/BREMA/BBC]) and other
  160.                 TV work, at least in the UK; also long play DAT and
  161.                 Japanese HDTV.
  162.  
  163. 37.8 k          CD-ROM/XA standard for higher quality.
  164.  
  165. 44056           This weird rate is used by professional audio
  166.                 equipment to fit an integral number of samples in a
  167.                 video frame.
  168.  
  169. 44100           The CD sampling rate.  (DAT players recording
  170.                 digitally from CD also use this rate.)
  171.  
  172. 48000           The DAT (Digital Audio Tape) sampling rate for
  173.                 domestic use.
  174.  
  175. Files samples on SoundBlaster hardware have sampling rates that are
  176. divisors of 1000000.
  177.  
  178. While professinal musicians disagree, most people don't have a problem
  179. if recorded sound is played at a slightly different rate, say, 1-2%.
  180. On the other hand, if recorded data is being fed into a playback
  181. device in real time (say, over a network), even the smallest
  182. difference in sampling rate can frustrate the buffering scheme used...
  183.  
  184. There may be an emerging tendency to standardize on only a few
  185. sampling rates and encoding styles, even if the file formats may
  186. differ.  The suggested rates and styles are:
  187.  
  188.     rate (samp/sec) style mono/stereo
  189.  
  190.     8000 8-bit U-LAW mono
  191.     22050 8-bit linear unsigned mono and stereo
  192.     44100 16-bit linear signed mono and stereo
  193.  
  194.  
  195. Compression schemes
  196. -------------------
  197.  
  198. Strange though it seems, audio data is remarkably hard to compress
  199. effectively.  For 8-bit data, a Huffman encoding of the deltas between
  200. successive samples is relatively successful.  For 16-bit data,
  201. companies like Sony and Philips have spent millions to develop
  202. proprietary schemes.  Information about PASC (Philips' scheme) can be
  203. found in Advanced Digital Audio by Ken C. Pohlmann.
  204.  
  205. Public standards for voice compression are slowly gaining popularity,
  206. e.g. CCITT G.721 and G.723 (ADPCM at 32 and 24 kbits/sec).  (ADPCM ==
  207. Adaptive Delta Pulse Code Modulation.)  Free source code for a *fast*
  208. 32 kbits/sec ADPCM algorithm is available by ftp from ftp.cwi.nl as
  209. /pub/adpcm.shar.  (** NOTE: if you are using v1.0, you should get
  210. v1.1, released 17-Dec-1992, which fixes a serious bug -- the quality
  211. of v1.1 is claimed to be better than uLAW **)
  212.  
  213. GSM 06.10 is a speech encoding in use in Europe that compresses 160
  214. 13-bit samples into 260 bits (or 33 bytes), i.e. 1650 bytes/sec (at
  215. 8000 samples/sec).  A free implementation can be ftp'ed from
  216. tub.cs.tu-berlin.de, file /pub/tubmik/gsm-1.0.tar.Z.
  217.  
  218. There are also two US federal standards, 1016 (Code excited linear
  219. prediction (CELP), 4800 bits/s) and 1015 (LPC-10E, 2400 bits/s).  See
  220. also the appendix for 1016.
  221.  
  222. (Note that U-LAW and silence detection can also be considered
  223. compression schemes.)
  224.  
  225. Here's a note about audio codings by Van Jacobson <van@ee.lbl.gov>:
  226. Several people used the words "LPC" and "CELP" interchangably.  They
  227. are very different.  An LPC (Linear Predictive Coding) coder fits
  228. speech to a simple, analytic model of the vocal tract, then throws
  229. away the speech & ships the parameters of the best-fit model.  An LPC
  230. decoder uses those parameters to generate synthetic speech that is
  231. usually more-or-less similar to the original.  The result is
  232. intelligible but sounds like a machine is talking.  A CELP (Code
  233. Excited Linear Predictor) coder does the same LPC modeling but then
  234. computes the errors between the original speech & the synthetic model
  235. and transmits both model parameters and a very compressed
  236. representation of the errors (the compressed representation is an
  237. index into a 'code book' shared between coders & decoders -- this is
  238. why it's called "Code Excited").  A CELP coder does much more work
  239. than an LPC coder (usually about an order of magnitude more) but the
  240. result is much higher quality speech: The FIPS-1016 CELP we're working
  241. on is essentially the same quality as the 32Kb/s ADPCM coder but uses
  242. only 4.8Kb/s (the same as the LPC coder).
  243.  
  244. The comp.compression FAQ has some text on the 6:1 audio compression
  245. scheme used by MPEG (a video compression standard-to-be).  It's
  246. interesting to note that video compression reaches much higher ratios
  247. (like 26:1).  This FAQ is ftp'able from rtfm.mit.edu [18.72.1.58] in
  248. directory /pub/usenet/news.answers/compression-faq, files part1 and
  249. part2.
  250.  
  251. Comp.compression also carries a regular posting "How to uncompress
  252. anything" by David Lemson <lemson@uiuc.edu>, which (tersely) hints on
  253. which program you need to uncompress a file whose name ends in .<foo>
  254. for almost any conceivable <foo>.  Ftp'able from ftp.cso.uiuc.edu
  255. (128.174.5.59) in the directory /doc/pcnet as the file compression.
  256.  
  257. Documentation on a digital cellular telephone system by Qualcomm Inc.
  258. can be ftp'ed from ftp.qualcomm.com:/pub/cdma; the vocoder is in
  259. appendix A.
  260.  
  261. Apple has an Audio Compression/Expansion scheme called ACE (on the GS)
  262. / MACE (on the Macintosh).  It's a lossy scheme that attempts to
  263. predict where the wave will go on the next sample. There's very little
  264. quality change on 8:4 compression, somewhat more for 8:3.  It does
  265. guarantee exactly 50% or 62.5% compression, though.  I believe MACE
  266. uses larger ratios/more loss, but I'm unsure of the specific numbers.
  267. (Marc Sira)
  268.  
  269.  
  270. Current hardware
  271. ----------------
  272.  
  273. I am aware of the following computer systems that can play back and
  274. (sometimes) record audio data, with their characteristics.  Note that
  275. for most systems you can also buy "professional" sampling hardware,
  276. which supports much better quality, e.g. >= 44.1 k 16 bits stereo.
  277. The characteristics listed here are a rough estimate of the
  278. capabilities of the basic hardware only (and even here I am on thin
  279. ice, with systems becoming ever more powerful).
  280.  
  281. machine             bits            max sampling rate    #output channels
  282.  
  283. Mac (all types)     8               22k                  1
  284. Mac (newer ones)   16               64k                  4(128)
  285. Apple IIgs          8               32k / >70k           16(st)
  286. PC/Soundblaster v1  8               13k / 22k            1
  287. PC/Soundblaster v2  8               15k / 44.1k          1
  288. PC/PAS-16           16              44.1k                ?(st)
  289. Atari ST            8               22k                  1
  290. Atari STe,TT        8               50k                  2
  291. Atari Falcon 030    16              50k                  8(st)
  292. Amiga               8               varies above 29k     4(st)
  293. Sun Sparc           U-LAW           8k                   1
  294. Sun Sparcst. 10     U-LAW,8,16      48k                  1(st)
  295. NeXT                U-LAW,8,16      44.1k                1(st)
  296. SGI Indigo          8,16            48k                  4(st)
  297. SGI Indigo2         8,16            48k                  16(st,4-channel)
  298. Acorn Archimedes    ~U-LAW          ~180k                8(st)
  299. Sony RISC-NEWS      8, 16           37.8k                ?(st)
  300. VAXstation 4000     U-LAW           8k                   1
  301. DEC 3000/300-500    U-LAW           8k                   1
  302. Tandy 1000/*L*      8               22k                  3
  303. HP9000/705,710,425e U,A-LAW,16      8k                   1
  304. HP9000/715,725,735  U,A-LAW,16      48k                  1(st)
  305. HP9000/755 option:  U,A-LAW,16      48k                  1(st)
  306.  
  307. 4(st) means "four voices, stereo"; sampling rates xx/yy are
  308. different recording/playback rates; *L* is any type with 'L' in it.
  309.  
  310. All these machines can play back sound without additional hardware,
  311. although the needed software is not always standard; also, some
  312. machines need external hardware to record sound (or to record at
  313. higher quality, like the NeXT, whose built-in sampling hardware only
  314. does 8000 samples/sec in U-LAW).  Please don't send me details on
  315. optional or 3rd party hardware, there is too much and it is really
  316. beyond the scope of this FAQ.
  317.  
  318. The new VAXstation 4000 (VLC and model 60) series lets you PLAY audio
  319. (.au) files, and the package DECsound will let you do the recording.
  320. In fact, DECsound is given away free with Motif 1.1 and supports the
  321. VAXstation, Sun SPARCstation, DECvoice, and DECaudio devices.  Sun
  322. sound files work without change.  The Alpha systems (DEC 3000 Model
  323. 300, 400, 500) also have DECsound bundled with Motif.
  324.  
  325. The SGI Personal IRIS 4D/30 and 4D/35 have the same capabilities as
  326. the Indigo. The audio board was optional on the 4D/30.
  327. The Indigo2 features are a superset of the Indigo features.
  328.  
  329. The new Apple Macs have more powerful audio hardware; the latest
  330. models have built-in microphones.
  331.  
  332. Software exists for the PC that can play sound on its 1-bit speaker
  333. using pulse width modulation (see appendix); the Soundblaster board
  334. records at rates up to 13 k and plays back up to 22 k (weird
  335. combination, but that's the way it is).
  336.  
  337. Here's some info about the newest Atari machine, the Falcon030.  This
  338. machine has stereo 16 bit CODECs and a 32 MHz Motorola 56001 that can
  339. handle 8 channels of 16 bit audio, up to 50 khz/channel with
  340. simultaneous playback and record.  The Falcon DMA sound engine is also
  341. compatible with the 8 bit stereo DMA used on the STe and TT. All of
  342. these systems use signed data.
  343.  
  344. On the NeXT, the Motorola 56001 DSP chip is programmable and you can
  345. (in principle) do what you want.  The SGI Indigo uses the same DSP chip but
  346. it can't be programmed by users -- SGI prefers to offer it as a shared
  347. system resource to multiple applications, thus enabling developers to
  348. program audio with their Audio Library and avoid code modifications
  349. for execution on future machines with different audio hardware, i.e. a
  350. different DSP. For example, the Indigo2 does not have a DSP chip.
  351.  
  352. The Amiga also has a 6-bit volume, which can be used to produce
  353. something like a 14-bit output for each voice.  The hardware can also
  354. use one of each voice-pair to modulate the other in FM (period) or AM
  355. (volume, 6-bits).
  356.  
  357. The Acorn Archimedes uses a variation on U-LAW with the bit order
  358. reversed and the sign bit in bit 0.  Being a 'minority' architecture,
  359. Arc owners are quite adept at converting sound/image formats from
  360. other machines, and it is unlikely that you'll ever encounter sound in
  361. one of the Arc's own formats (there are several).
  362.  
  363. CD-I machines form a special category.  The following formats are used:
  364.  
  365.      - PCM 44.1 kHz standard CD format
  366.      - ADPCM - Addaptive Delta PCM
  367.        - Level A 37.8 kHz 8-bit
  368.        - Level B 37.8 kHz 4-bit
  369.        - Level C 18.9 kHz 4-bit
  370.  
  371.  
  372. File formats
  373. ------------
  374.  
  375. Historically, almost every type of machine used its own file format
  376. for audio data, but some file formats are more generally applicable,
  377. and in general it is possible to define conversions between almost any
  378. pair of file formats -- sometimes losing information, however.
  379.  
  380. File formats are a separate issue from device characteristics.  There
  381. are two types of file formats: self-describing formats, where the
  382. device parameters and encoding are made explicit in some form of
  383. header, and "raw" formats, where the device parameters and encoding
  384. are fixed.
  385.  
  386. Self-describing file formats generally define a family of data
  387. encodings, where a header fields indicates the particular encoding
  388. variant used.  Headerless formats define a single encoding and usually
  389. allows no variation in device parameters (except sometimes sampling
  390. rate, which can be a pain to figure out other than by listening to the
  391. sample).
  392.  
  393. The header of self-describing formats contains the parameters of the
  394. sampling device and sometimes other information (e.g. a
  395. human-readable description of the sound, or a copyright notice).  Most
  396. headers begin with a simple "magic word".  (Some formats do not simply
  397. define a header format, but may contain chunks of data intermingled
  398. with chunks of encoding info.)  The data encoding defines how the
  399. actual samples are stored in the file, e.g. signed or unsigned, as
  400. bytes or short integers, in little-endian or big-endian byte order,
  401. etc.  Strictly spoken, channel interleaving is also part of the
  402. encoding, although so far I have seen little variation in this area.
  403.  
  404. Some file formats apply some kind of compression to the data, e.g.
  405. Huffman encoding, or simple silence deletion.
  406.  
  407. Here's an overview of popular file formats.
  408.  
  409.         Self-describing file formats
  410.         ----------------------------
  411.  
  412. extension, name   origin          variable parameters (fixed; comments)
  413.  
  414. .au or .snd       NeXT, Sun       rate, #channels, encoding, info string
  415. .aif(f), AIFF     Apple, SGI      rate, #channels, sample width, lots of info
  416. .aif(f), AIFC     Apple, SGI      same (extension of AIFF with compression)
  417. .iff, IFF/8SVX    Amiga           rate, #channels, instrument info (8 bits)
  418. .voc              Soundblaster    rate (8 bits/1 ch; can use silence deletion)
  419. .wav, WAVE        Microsoft       rate, #channels, sample width, lots of info
  420. .sf               IRCAM           rate, #channels, encoding, info
  421. none, HCOM        Mac             rate (8 bits/1 ch; uses Huffman compression)
  422. none, MIME        Internet        (see below)
  423. .mod or .nst      Amiga           (see below)
  424.  
  425. Note that the filename extension ".snd" is ambiguous: it can be either
  426. the self-describing NeXT format or the headerless Mac/PC format, or
  427. even a headerless Amiga format.
  428.  
  429. I know nothing for sure about the origin of HCOM files, only that
  430. there are a lot of them floating around on our system and probably at
  431. FTP sites over the world.  The filenames usually don't have a ".hcom"
  432. extension, but this is what SOX (see below) uses.  The file format
  433. recognized by SOX includes a MacBinary header, where the file
  434. type field is "FSSD".  The data fork begins with the magic word "HCOM"
  435. and contains Huffman compressed data; after decompression it it is 8
  436. bits unsigned data.
  437.  
  438. IFF/8SVX allows for amplitude contours for sounds (attack/decay/etc).
  439. Compression is optional (and extensible); volume is variable; author,
  440. notes and copyright properties; etc.
  441.  
  442. AIFF, AIFC and WAVE are similar in spirit but allow more freedom in
  443. encoding style (other than 8 bit/sample), amongst others.
  444.  
  445. There are other sound formats in use on Amiga by digitizers and music
  446. programs, such as IFF/SMUS.
  447.  
  448. Appendices describes the NeXT and VOC formats; pointers to more info
  449. about AIFF, AIFC, 8SVX and WAVE (which are too complex to describe
  450. here) are also in appendices.
  451.  
  452. DEC systems (e.g. DECstation 5000) use a variant of the NeXT format
  453. that uses little-endian encoding and has a different magic number
  454. (0x0064732E in little-endian encoding).
  455.  
  456. Standard file formats used in the CD-I world are IFF but on the disc
  457. they're in realtime files.
  458.  
  459. An interesting "interchange format" for audio data is described in the
  460. proposed Internet Standard "MIME", which describes a family of
  461. transport encodings and structuring devices for electronic mail.  This
  462. is an extensible format, and initially standardizes a type of audio
  463. data dubbed "audio/basic", which is 8-bit U-LAW data sampled at 8000
  464. samples/sec.
  465.  
  466. The "IRCAM" sound file system has now been superseded by the so-called
  467. "BICSF" (for Berkeley/IRCAM/CARL Sound File system) software release.
  468. More recently, there has been an effort at Princeton (Prof. Paul
  469. Lansky) and Stanford (Stephen Travis Pope) to standardize several
  470. extensions to BICSF.  A description of BICSF and the
  471. Princeton/Stanford extensions is available by anonymous ftp from
  472. ftp.cwi.nl [192.16.184.180], in directory /pub/audio/BICSF-info.  This
  473. file contains further ftp pointers to software.
  474.  
  475. Finally, a somewhat different but popular format are "MOD" files,
  476. usually with extension ".mod" or ".nst" (they can also have a prefix
  477. of "mod.").  This originated at the Amiga but players now exist for
  478. many platforms.  MOD files are music files containing 2 parts: (1) a
  479. bank of digitized samples; (2) sequencing information describing how
  480. and when to play the samples.  See the appendix "The Amiga MOD Format"
  481. for a description of this file format (and pointers to ftp'able
  482. players and example MOD files).
  483.  
  484.         Headerless file formats
  485.         -----------------------
  486.  
  487. extension       origin          parameters
  488. or name
  489.  
  490. .snd, .fssd     Mac, PC         variable rate, 1 channel, 8 bits unsigned
  491. .ul             US telephony    8 k, 1 channel, 8 bit "U-LAW" encoding
  492. .snd?           Amiga           variable rate, 1 channel, 8 bits signed
  493.  
  494. It is usually easy to distinguish 8-bit signed formats from unsigned
  495. by looking at the beginning of the data with 'od -b <file | head';
  496. since most sounds start with a little bit of silence containing small
  497. amounts of background noise, the signed formats will have an abundance
  498. of bytes with values 0376, 0377, 0, 1, 2, while the unsigned formats
  499. will have 0176, 0177, 0200, 0201, 0202 instead.  (Using "od -c" will
  500. also show any headers that are tacked in front of the file.)
  501.  
  502. The Apple IIgs records raw data in the same format as the Mac, but
  503. uses a 0 byte as a terminator; samples with value 0 are replaced by 1.
  504.  
  505.         Sound formats and the Apple Macintosh
  506.         -------------------------------------
  507.  
  508. (Thanks to Bill Houle, <Bill.Houle@SanDiegoCA.NCR.COM>)
  509.  
  510.                              SOX/DOS   MAC
  511. Sound Format           file ext  type  Mac program: convert to 'snd'
  512. ---------------------- --------  ----  ------------------------------
  513. Mac snd                .snd      sfil  n/a
  514. Amiga IFF/8SVX         .iff            AmigaSndConverter
  515. Amiga SoundTracker     .mod      STrk  ModVoicer
  516. Audio IFF              .aiff     AIFF  SoundExtractor, Sample Editor,
  517. UUTool
  518. DSP Designer                     DSPs  SoundHack
  519. IRCAM                  .sf       IRCM  SoundHack
  520. MacMix                           MSND  SoundHack
  521. RIFF WAVE              .wav            SoundExtractor
  522. SoundBlaster           .voc            SoundExtractor
  523. SoundDesigner/AudioMedia         Sd2f  SoundHack
  524. Sound[Edit|Cap|Wave]   .hcom     FSSD  SoundExtractor, SoundEdit
  525. Wavicle
  526. Sun uLaw/Next .snd     .au/.snd  NxTS  SoundExtractor, SoundHack
  527. au<->snd, UUTool
  528.  
  529.  
  530. File conversions
  531. ----------------
  532.  
  533.         SOX (UNIX, PC, Amiga)
  534.         ---------------------
  535.  
  536. The most versatile tool for converting between various audio formats
  537. is SOX ("Sound Exchange").  It can read and write various types of
  538. audio files, and optionally applies some special effects (e.g. echo,
  539. channel averaging, or rate conversion).
  540.  
  541. SOX recognizes all filename extensions listed above except ".snd",
  542. which would be ambiguous anyway, and ".wav" (but there's a patch, see
  543. below).  Use type ".au" for NeXT ".snd" files.  Mac and PC ".snd"
  544. files are completely described by these parameters:
  545.  
  546.         -t raw -b -u -r 11000
  547.  
  548. (or -r 22000 or -r 7333 or -r 5500; 11000 seems to be the most common
  549. rate).
  550.  
  551. The source for SOX, version 6, platchlevel 8, was posted to
  552. alt.sources, and should be widely archived.  (Patch 9 was posted later
  553. and incporporates some important .wav fixes.)  To save you the trouble
  554. of hunting it down, it can be gotten by anonymous ftp from
  555. wuarchive.wustl.edu, in the directory usenet/alt.sources/articles,
  556. files 7288.Z through 7295.Z.  (These files are compressed news
  557. articles containing shar files, if you hadn't guessed.)  I am sure
  558. many sites have similar archives, I'm just listing one that I know of
  559. and which carries a lot of this kind of stuff.  (Also see the appendix
  560. if you don't have Internet access.)
  561.  
  562. A compressed tar file containing the same version of SOX is available
  563. by anonymous ftp from ftp.cwi.nl [192.16.184.180], in directory
  564. /pub/audio/sox7.tar.Z.  You may be able to locate a nearer version
  565. using archie!
  566.  
  567. Ports of SOX:
  568.  
  569. - The source as posted should compile on any UNIX and PC system.
  570.  
  571. - A PC version is available by ftp from ftp.cwi.nl (see above) as
  572.   pub/audio/sox5dos.zip; also available from the garbo mail server.
  573.  
  574. - The latest Amiga SOX is available via anonymous ftp to
  575.   wuarchive.wustl.edu, files systems/amiga/audio/utils/amisox*.  (See
  576.   below for a non-SOX solution.)
  577.   The final release of r6 will compile as distributed on the Amiga with
  578.   SAS/C version 6.  Binaries (since many Amiga users do not own
  579.   compilers) will continue to be available for FTP.
  580.  
  581. SOX usage hints:
  582.  
  583. - Often, the filename extension of sound files posted on the net is
  584.   wrong.  Don't give up, try a few other possibilities using the
  585.   "-t <type>" option.  Remember that the most common file type is
  586.   unsigned bytes, which can be indicated with "-t ub".  You'll have to
  587.   guess the proper sampling rate, but often it's 11k or 22k.
  588.  
  589. - In particular, with SOX version 4 (or earlier), you have to
  590.   specify "-t 8svx" for files with an .iff extension.
  591.  
  592. - When converting linear samples to U-LAW using the .au type for the
  593.   output file, you must specify "-U" for the output file, otherwise
  594.   you will end up with a file containing a NeXT/Sun header but linear
  595.   samples -- only the NeXT will play such files correctly.  Also, you
  596.   must explicitly specify an output sampling rate with "-r 8000".
  597.   (This may seem fixed for most cases in version 5, but it is still
  598.   occasionally necessary, so I'm keeping this warning in.)
  599.  
  600.         Sun Sparc
  601.         ---------
  602.  
  603. On Sun Sparcs, starting at SunOS 4.1, a program "raw2audio" is
  604. provided by Sun (in /usr/demo/SOUND -- see below) which takes a raw
  605. U-LAW file and turns it into a ".au" file by prefixing it with an
  606. appropriate header.
  607.  
  608.         NeXT
  609.         ----
  610.  
  611. On NeXTs, you can usually rename .au files to .snd and it'll work like
  612. a charm, but some .au files lack header info that the NeXT needs.
  613. This can be fixed by using sndconvert:
  614.  
  615.         sndconvert -c 1 -f 1 -s 8012.8210513 -o nextfile.snd sunfile.au
  616.  
  617.         SGI Indigo and Personal IRIS
  618.         ----------------------------
  619.  
  620. SGI supports "soundfiler" (in /usr/sbin), a program similar in
  621. spirit to SOX but with a GUI.  Soundfiler plays aiff, aifc, NeXT/Sun
  622. and .wav formats.  It can do conversions between any of these formats
  623. and to and from raw formats including mulaw.  It also does sample rate
  624. conversions.
  625.  
  626. Three shell commands are also provided that give the same functionality:
  627. "sfplay", "sfconvert", and "aifcresample" (all in /usr/sbin).
  628.  
  629.         Amiga
  630.         -----
  631.  
  632. Mike Cramer's SoundZAP can do no effects except rate change and it
  633. only does conversions to IFF, but it is generally much faster than
  634. SOX.  (Ftp'able from the same directory as amisox above.)
  635.  
  636. Newer versions of OmniPlay (see below) will also convert to IFF.
  637.  
  638.         Tandy
  639.         -----
  640.  
  641. The Tandy 1000 uses a (proprietary?) compressed format.  There is a
  642. PD Mac to Tandy conversion program called CONVERT.
  643.  
  644.         Apple Macintosh
  645.         ---------------
  646.  
  647. Bill Houle sent the following list:
  648.  
  649. SoundHack, Tom Erbe: can read/write Sound Designer II, Audio IFF,
  650. IRCAM, DSP Designer and NeXT .snd (or Sun .au); 8-bit uLaw, 8-bit
  651. linear, 32-bit floating point and 16-bit linear data encoding.  Can
  652. read (but not write) raw data files.  Implements soundfile
  653. convolution, a phase vocoder, a binaural filter and an amplitude
  654. analysis & gain change module.
  655.  
  656. AmigaSndConverter, Povl H. Pederson: converts Amiga IFF/8SVX to Mac 'snd'.
  657.  
  658. SoundExtractor, Alberto Ricci: extracts 'snd' resources, AIFF, SoundEdit,
  659. VOC, and WAV data from practically anything, converting to 'snd' files.
  660.  
  661. au<->Mac, Victor J. Heinz: converts Sun uLaw files to Mac 'snd' files.
  662.  
  663. UUTool, Bernie Wieser: primarily a uuencode/decode program, but can
  664. also read/write Sun uLaw, AIFF, and 'snd' files.
  665.  
  666. ModVoicer, Kip Walker: converts Amiga MOD voices into SoundEdit files
  667. or 'snd' resources.
  668.  
  669. Most programs mentioned are shareware/freeware available from SUMEX
  670. and the various mirror sites, or check archie for the nearest FTP
  671. site.
  672.  
  673.  
  674. Playing audio files on UNIX
  675. ---------------------------
  676.  
  677. The commands needed to play an audio file depend on the file format
  678. and the available hardware and software.  Most systems can only
  679. directly play sound in their native format; use a conversion program
  680. (see above) to play other formats.
  681.  
  682.         Sun Sparcstation running SunOS 4.x
  683.         ----------------------------------
  684.  
  685. Raw U-LAW files can be played using "cat file >/dev/audio".
  686.  
  687. A whole package for dealing with ".au" files is provided by Sun on an
  688. experimental basis, in /usr/demo/SOUND.  You may have to compile the
  689. programs first.  (If you can't find this directory, either you are not
  690. running SunOS 4.1 yet, or your system administrator hasn't installed
  691. it -- go ask him for it, not me!)  The program "play" in this
  692. directory recognizes all files in Sun/NeXT format, but a SS 1 or 2 can
  693. play only those using U-LAW encoding at 8 k -- the SS 10 hardware
  694. plays other encodings, too.
  695.  
  696. If you ca't find "play", you can also cat a ".au" file to /dev/audio,
  697. if it uses U-LAW; the header will sound like a short burst of noise
  698. but the rest of the data will sound OK (really, the only difference in
  699. this case between raw U-LAW and ".au" files is the header; the U-LAW
  700. data is exactly the same).
  701.  
  702. Finally, OpenWindows 3.0 has a full-fledged audio tool.  You can drop
  703. audio file icons into it, edit them, etc.
  704.  
  705.         Sun Sparcstation running Solaris 2.0
  706.         ------------------------------------
  707.  
  708. Under SVR4 (and hence Solaris 2.0), writing to /dev/audio from the
  709. shell is a bad idea, because the device driver will flush its queue as
  710. soon as the file is closed.  Use "audioplay" instead.  The supported
  711. formats and sampling rates are the same as above.
  712.  
  713.         NeXT
  714.         ----
  715.  
  716. On NeXT machines, the standard "sndplay" program can play all NeXT
  717. format files (this include Sun ".au" files).  It supports at least
  718. U-LAW at 8 k and 16 bits samples at 22 or 44.1 k.  It attempts
  719. on-the-fly conversions for other formats.
  720.  
  721. Sound files are also played if you double-click on them in the file
  722. browser.
  723.  
  724.         SGI Indigo and Personal IRIS
  725.         ----------------------------
  726.  
  727. On SGI Indigo, Indigo2 and the 4D/30 and /35 Personal IRIS workstations,
  728. "WorkSpace" plays audio files in .aiff, .aifc, .au, and .wav formats if
  729. you double click them and the sampling rate is one of 8000, 11025,
  730. 16000, 22050, 32000, 44100, or 48000.  On the Personal IRIS, you need
  731. to have the audio board installed (check the output from hinv) and you
  732. must run IRIX 3.3.2 or 4.0 or higher.  These files can also be played
  733. with "soundfiler" and "sfplay".  ".aiff" and ".aifc" files at the above
  734. sampling rates can also be played with playaifc.  (All in /usr/sbin)
  735.  
  736. There is no simple /dev/audio interface on these SGI machines.  (There
  737. was one on 4D/25 machines, reading and writing signed linear 8-bit
  738. samples at rates of 8, 16 and 32 k.)
  739.  
  740. A program "playulaw" was posted as part of the "radio 2.0" release
  741. that I posted to several source groups; it plays raw U-LAW files on
  742. the Indigo, Indigo2 or Personal IRIS audio hardware.
  743.  
  744.         Sony NEWS
  745.         ---------
  746.  
  747. The Sony RISC-NEWS line (NWS-3250 laptop, NWS-37xx desktop, NWS-38xx
  748. desktop w/ IOP) also has builtin sound capabilities.  You can also buy
  749. external boards for the older NEWS machines or to add extra channels
  750. to the new machines.  In the default mode (8k/8-bit), Sun .au files
  751. are directly supported (you can 'cat' .au files to /dev/sb and have
  752. them play).
  753.  
  754.         Others
  755.         ------
  756.  
  757. Most other UNIX boxes don't have audio hardware and thus can't play
  758. audio data.  This is actually rapidly changing and most new hardware
  759. that hits the market has some form of audio support.  Unfortunately
  760. there is nothing like X11 that provides a portable interface.  Perhaps
  761. DEC CRL's AudioFile system can fill the gap; it is network-transparent
  762. and supports at least Digital RISC systems running Ultrix, Digital
  763. Alpha AXP systems running OSF/1, Sun Microsystems SPARCstations
  764. running SunOS, and SGI Indigos.  The source kit is located at ftp site
  765. crl.dec.com (Internet 192.58.206.2) in /pub/DEC/AF.
  766.  
  767.  
  768. Playing audio files on the Vaxstation 4000 (VMS)
  769. ------------------------------------------------
  770.  
  771. 1) Without DECsound
  772.  
  773. ".au" files can be played by COPYING them to device "SOA0:".  This
  774. device is set up by enabling the driver SODRIVER.  You can use the
  775. following command file:
  776.  
  777. $!---------------- cut here -------------------------------
  778. $! sound_setup.com    enable SOUND driver
  779. $ run sys$system:sysgen
  780. connect soa0 /adapter=0 /csr=%x0e00 /vector=%o304 /driver=sodriver
  781. exit
  782. $ exit
  783. $!----------------- cut here ------------------------------------
  784.  
  785. 2) With DECsound (bundled with motif)
  786.  
  787. Just start DECsound by selecting it from the session manager in the 
  788. applications menu. (Not there use "@vue$library:sound$vue_startup").
  789. Make sure settings; device type (vaxstation 4000) and play settings
  790. (headphone jack) are selected.  To play files from the DCL prompt 
  791. (handy if you want to play sounds on a remote workstation) set a 
  792. symbol up as follows; 
  793. PLAY == "$DECSOUND -VOLUME 50 -PLAY"
  794. usage;
  795. DCL> play sound.au
  796.  
  797. 3) Audio port
  798.  
  799. The external audio port comes with a telephone-jack-like port.   For
  800. starters, you can plug a telephone RECEIVER right into this port to
  801. hear your first sound files.   After that, you can use the adapter
  802. (that came with the VaxStation), and plug in a small set of stereo
  803. speakers or headphones (the kind you'd plug into a WALKMAN, for 
  804. example), for more volume.  The adapter also has a microphone plug so
  805. that you can record sounds if DECsound is installed.
  806.  
  807.  
  808. Playing audio files on micros
  809. -----------------------------
  810.  
  811. Most micros have at least a speaker built in, so theoretically all you
  812. need is the right software.  Unfortunately most systems don't come
  813. bundled with sound-playing software, so there are many public domain
  814. or shareware software packages, each with their own bugs and features.
  815. Most separate sound recording hardware also comes with playing
  816. software, most of which can play sound (in the file format used by
  817. that hardware) even on machines that don't have that hardware
  818. installed.
  819.  
  820.         PC or compatible
  821.         ----------------
  822.  
  823. Chris S. Craig announces the following software for PCs:
  824.  
  825. ScopeTrax       This is a complete PC sound player/editor package.  Sounds
  826.                 can be played back at ANY rate between 1kHz to 65kHz through
  827.                 the PC speaker or the Sound Blaster.  It supports several
  828.                 file formats including VOC, IFF/8SVX, raw signed and raw
  829.                 unsigned.  A separate executable is provided to convert
  830.                 .au and mu-law to raw format.  ScopeTrax requires EGA/VGA
  831.                 graphics for editing and displaying sounds on a REALTIME
  832.                 oscilloscope.  The package also includes:
  833.                       * An expanded memory player which can play sounds
  834.                         larger than 640K in size.
  835.                       * Basic (rough) sound compression/uncompression
  836.                         utilities.
  837.                       * Complete documentation.
  838.                 The package is FREEWARE!  It is available on SIMTEL in the
  839.                 PD1:[MSDOS.SOUND] directory.
  840.  
  841. One of the appendices below contains a list of more programs to play
  842. sound on the PC.
  843.  
  844.         Atari
  845.         -----
  846.  
  847. For sounds on Atari STs - programs are in the atari/sound/players
  848. directory on atari.archive.umich.edu (141.211.164.8).
  849.  
  850.         Tandy
  851.         -----
  852.  
  853. On a Tandy 1000, sounds can be played and recorded with DeskMate Sound
  854. (SOUND.PDM), or if they not stored in compressed format, they can also
  855. be played be a program called PLAYSND.  No indication of whether
  856. PLAYSND is PD or not. It hasn't been updated since March of 89.
  857.  
  858.         Amiga
  859.         -----
  860.  
  861. On the Amiga, OmniPlay by David Champion <dgc3@midway.uchicago.edu>
  862. plays and converts IFF-8SVX, AIFF, WAV, VOC, .au, .snd, and 8 bit raw
  863. (signed, unsigned, u-law) samples.  As of version 1.23, OmniPlay will
  864. also convert any playable sample to 8SVX.  Files: wuarchive.wustl.edu
  865. in /systems/amiga/audio/sampleplayers/oplay123.lha (?)
  866. amiga.physik.unizh.ch in mus/play/oplay123.lha
  867.  
  868.         Apple Macintosh
  869.         ---------------
  870.  
  871. Malcolm Slaney from Apple writes:
  872.  
  873.  "We do have tools to play sound back on most of our Unix hosts.  We wrote
  874.  a program called TcpPlay that lets us read a sound file on a Unix host,
  875.  open a TCP/IP connection to the Mac on my desk, and plays the file.  We
  876.  think of it as X windows for sound (at least a step in that direction.)
  877.  
  878.  This software is available for anonymous FTP from ftp.apple.com.
  879.  Look for  ~ftp/pub/TcpPlay/TcpPlay.sit.hqx.
  880.  
  881.  Finally, there are MANY tools for working with sound on the Macintosh. Three
  882.  applications that come to mind immediately are SoundEdit (formerly by
  883.  Farralon and now by MacroMind/Paracomp), Alchemy and Eric Keller's Signalyze.
  884.  There are lots of other tools available for sound editing (including some
  885.  of the QuickTime Movie tools.)"
  886.  
  887. Bill Houle sent the following lists:
  888.  
  889. EDITORS:
  890.  
  891. Sample Editor, Garrick McFarlane: plays AIFF and 'snd' sounds.  Can convert
  892. between AIFF and 'snd'.  Can record from built-in mic.  Can add effects such
  893. as fade, normalize, delay, etc.
  894.  
  895. Wavicle, Lee Fyock: plays SoundEdit files.  Can convert to 'snd'.  Can record
  896. from built-in mic.  Can add effects such as fade, filter, reverb, etc.
  897.  
  898. [*]SoundEdit, Farallon: plays SoundEdit and 'snd' sounds.  Can read/write 
  899. SoundEdit files and 'snd' sounds.  Can record from built-in mic.  Can add 
  900. effects such as echo, filter, reverb, etc.
  901.  
  902. PLAYERS:
  903.  
  904. The Player, Antoine Rosset & Mike Venturi: plays AIFF, SoundEdit, MOD, and 
  905. 'snd' files.
  906.  
  907. SoundMaster (aka [*]Kaboom!), Bruce Tomlin: associates SoundEdit files to 
  908. MacOS events.
  909.  
  910. SndControl, Riccardo Ettore: associates 'snd' sounds to MacOS events.
  911.  
  912. Most programs mentioned are shareware/freeware available from SUMEX
  913. and the various mirror sites, or check archie for the nearest FTP
  914. site.  Popular commercial apps are indicated with a [*].
  915.  
  916.  
  917. The Sound Site Newsletter
  918. -------------------------
  919.  
  920. An electronic publication with lots of info about digitised sound and
  921. sound formats, albeit mostly on micros, is "The Sound Site
  922. Newsletter".  Issue 12 appeared in March 1993.  This used to be
  923. available by anonymouse ftp from saffron, but I have been informed
  924. that saffron is no longer providing this service.  If you know of a
  925. different site carrying recent issues of the Sound Site newsletter,
  926. please let me know!)
  927.  
  928.  
  929. Posting sounds
  930. --------------
  931.  
  932. The newsgroup alt.binaries.sounds.misc is dedicated to postings
  933. containing sound.  (Discussions related to such postings belong in
  934. alt.binaries.sounds.d.)
  935.  
  936. There is no set standard for posting sounds; uuencoded files in most
  937. popular formats are welcome, if split in parts under 50 kBytes.  To
  938. accomodate automatic decoding software (such as the ":decode" command
  939. of the nn newsreader), please place a part indicator of the form
  940. (mm/nn) at the end of your subject meaning this is number mm of a
  941. total of nn part.
  942.  
  943. It is recommended to post sounds in the format that was used for the
  944. original recording; conversions to other formats often lose
  945. information and would do people with identical hardware as the poster
  946. no favor.  For instance, convering 8-bit linear sound to U-LAW loses
  947. the lower few bits of the data, and rate changing conversions almost
  948. always add noise.  Converting from U-LAW to linear requires expansion
  949. to 16 bit samples if no information loss is allowed!
  950.  
  951. U-LAW data is best posted with a NeXT/Sun header.
  952.  
  953. If you have to post a file in a headerless format (usually 8-bit
  954. linear, like ".snd"), please add a description giving at least the
  955. sampling rate and whether the bytes are signed (zero at 0) or unsigned
  956. (zero at 0200).  However, it is highly recommended to add a header
  957. that indicates the sampling rate and encoding scheme; if necessary you
  958. can use SOX to add a header of your choice to raw data.
  959.  
  960. Compression of sound files usually isn't worth it; the standard
  961. "compress" algorithm doesn't save much when applied to sound data
  962. (typically at most 10-20 percent), and compression algorithms
  963. specifically designed for sound (e.g. NeXT's) are usually
  964. proprietary.  (See also the section "Compression schemes" earlier.)
  965.  
  966.   Inflating: A2  <to console>
  967.  
  968. Archive-name: audio-fmts/part2
  969. Submitted-by: Guido van Rossum <guido@cwi.nl>
  970. Version: 3.02
  971. Last-modified: 11-May-1993
  972.  
  973. Appendices
  974. ==========
  975.  
  976. Here are some more detailed pieces of info that I received by e-mail.
  977. They are reproduced here virtually without much editing.
  978.  
  979. Table of contents
  980. -----------------
  981.  
  982. FTP access for non-internet sites
  983. AIFF Format (Audio IFF)
  984. The NeXT/Sun audio file format
  985. IFF/8SVX Format
  986. Playing sound on a PC
  987. The EA-IFF-85 documentation
  988. US Federal Standard 1016 availability
  989. Creative Voice (VOC) file format
  990. RIFF WAVE (.WAV) file format
  991. U-LAW and A-LAW definitions
  992. AVR File Format
  993. The Amiga MOD Format
  994.  
  995. ------------------------------------------------------------------------
  996. FTP access for non-internet sites
  997. ---------------------------------
  998.  
  999. From the sci.space FAQ:
  1000.  
  1001.     Sites not connected to the Internet cannot use FTP directly, but
  1002.     there are a few automated FTP servers which operate via email.
  1003.     Send mail containing only the word HELP to ftpmail@decwrl.dec.com
  1004.     or bitftp@pucc.princeton.edu, and the servers will send you
  1005.     instructions on how to make requests.  (The bitftp service is no
  1006.     longer available through UUCP gateways due to complaints about
  1007.     overuse :-( )
  1008.  
  1009. Also:
  1010.  
  1011.     FAQ lists are available by anonymous FTP from pit-manager.mit.edu
  1012.     (18.72.1.58) and by email from mail-server@pit-manager.mit.edu (send
  1013.     a message containing "help" for instructions about the mail server).
  1014.  
  1015.  
  1016. ------------------------------------------------------------------------
  1017. AIFF Format (Audio IFF) and AIFC
  1018. --------------------------------
  1019.  
  1020. This format was developed by Apple for storing high-quality sampled
  1021. sound and musical instrument info; it is also used by SGI and several
  1022. professional audio packages (sorry, I know no names).  An extension,
  1023. called AIFC or AIFF-C, supports compression (see the last item below).
  1024.  
  1025. I've made a BinHex'ed MacWrite version of the AIFF spec (no idea if
  1026. it's the same text as mentioned below) available by anonymous ftp from
  1027. ftp.cwi.nl [192.16.184.180]; the file is /pub/audio/AudioIFF1.2.hqx.
  1028. But you may be better off with the AIFF-C specs, see below.
  1029.  
  1030. Mike Brindley (brindley@ece.orst.edu) writes:
  1031.  
  1032. "The complete AIFF spec by Steve Milne, Matt Deatherage (Apple) is
  1033. available in 'AMIGA ROM Kernal Reference Manual: Devices (3rd Edition)'
  1034. 1991 by Commodore-Amiga, Inc.; Addison-Wesley Publishing Co.; 
  1035. ISBN 0-201-56775-X, starting on page 435 (this edition has a charcoal
  1036. grey cover).  It is available in most bookstores, and soon in many
  1037. good librairies."
  1038.  
  1039. According to Mark Callow (msc@sgi.com):
  1040.  
  1041. A PostScript version of the AIFF-C specification is available via
  1042. anonymous ftp on FTP.SGI.COM (192.48.153.1) as /sgi/aiff-c.9.26.91.ps.
  1043.  
  1044. ------------------------------------------------------------------------
  1045. The NeXT/Sun audio file format
  1046. ------------------------------
  1047.  
  1048. Here's the complete story on the file format, from the NeXT
  1049. documentation.  (Note that the "magic" number is ((int)0x2e736e64),
  1050. which equals ".snd".)  Also, at the end, I've added a litte document
  1051. that someone posted to the net a couple of years ago, that describes
  1052. the format in a bit-by-bit fashion rather than from C.
  1053.  
  1054. I received this from Doug Keislar, NeXT Computer.  This is also the
  1055. Sun format, except that Sun doesn't recognize as many format codes.  I
  1056. added the numeric codes to the table of formats and sorted it.
  1057.  
  1058.  
  1059. SNDSoundStruct:  How a NeXT Computer Represents Sound
  1060.  
  1061. The NeXT sound software defines the SNDSoundStruct structure to  
  1062. represent sound.  This structure defines the soundfile and Mach-O  
  1063. sound segment formats and the sound pasteboard type.  It's also used  
  1064. to describe sounds in Interface Builder.  In addition, each instance  
  1065. of the Sound Kit's Sound class encapsulates a SNDSoundStruct and  
  1066. provides methods to access and modify its attributes.
  1067.  
  1068. Basic sound operations, such as playing, recording, and cut-and-paste  
  1069. editing, are most easily performed by a Sound object.  In many cases,  
  1070. the Sound Kit obviates the need for in-depth understanding of the  
  1071. SNDSoundStruct architecture.  For example, if you simply want to  
  1072. incorporate sound effects into an application, or to provide a simple  
  1073. graphic sound editor (such as the one in the Mail application), you  
  1074. needn't be aware of the details of the SNDSoundStruct.  However, if  
  1075. you want to closely examine or manipulate sound data you should be  
  1076. familiar with this structure.
  1077.  
  1078. The SNDSoundStruct contains a header, information that describes the  
  1079. attributes of a sound, followed by the data (usually samples) that  
  1080. represents the sound.  The structure is defined (in  
  1081. sound/soundstruct.h) as:
  1082.  
  1083. typedef struct {
  1084.     int magic;               /* magic number SND_MAGIC */
  1085.     int dataLocation;        /* offset or pointer to the data */
  1086.     int dataSize;            /* number of bytes of data */
  1087.     int dataFormat;          /* the data format code */
  1088.     int samplingRate;        /* the sampling rate */
  1089.     int channelCount;        /* the number of channels */
  1090.     char info[4];            /* optional text information */
  1091. } SNDSoundStruct;
  1092.  
  1093.  
  1094.  
  1095.  
  1096. SNDSoundStruct Fields
  1097.  
  1098.  
  1099.  
  1100. magic
  1101.  
  1102. magic is a magic number that's used to identify the structure as a  
  1103. SNDSoundStruct.  Keep in mind that the structure also defines the  
  1104. soundfile and Mach-O sound segment formats, so the magic number is  
  1105. also used to identify these entities as containing a sound.
  1106.  
  1107.  
  1108.  
  1109.  
  1110.  
  1111. dataLocation
  1112.  
  1113. It was mentioned above that the SNDSoundStruct contains a header  
  1114. followed by sound data.  In reality, the structure only contains the  
  1115. header; the data itself is external to, although usually contiguous  
  1116. with, the structure.  (Nonetheless, it's often useful to speak of the  
  1117. SNDSoundStruct as the header and the data.)  dataLocation is used to  
  1118. point to the data.  Usually, this value is an offset (in bytes) from  
  1119. the beginning of the SNDSoundStruct to the first byte of sound data.   
  1120. The data, in this case, immediately follows the structure, so  
  1121. dataLocation can also be thought of as the size of the structure's  
  1122. header.  The other use of dataLocation, as an address that locates  
  1123. data that isn't contiguous with the structure, is described in  
  1124. "Format Codes," below.
  1125.  
  1126.  
  1127.  
  1128.  
  1129.  
  1130. dataSize, dataFormat, samplingRate, and channelCount
  1131.  
  1132. These fields describe the sound data.
  1133.  
  1134. dataSize is its size in bytes (not including the size of the  
  1135. SNDSoundStruct).
  1136.  
  1137. dataFormat is a code that identifies the type of sound.  For sampled  
  1138. sounds, this is the quantization format.  However, the data can also  
  1139. be instructions for synthesizing a sound on the DSP.  The codes are  
  1140. listed and explained in "Format Codes," below.
  1141.  
  1142. samplingRate is the sampling rate (if the data is samples).  Three  
  1143. sampling rates, represented as integer constants, are supported by  
  1144. the hardware:
  1145.  
  1146. Constant        Sampling Rate (samples/sec) 
  1147.  
  1148. SND_RATE_CODEC  8012.821        (CODEC input)
  1149. SND_RATE_LOW    22050.0 (low sampling rate output)
  1150. SND_RATE_HIGH   44100.0 (high sampling rate output)
  1151.  
  1152. channelCount is the number of channels of sampled sound.
  1153.  
  1154.  
  1155.  
  1156.  
  1157.  
  1158. info
  1159.  
  1160. info is a NULL-terminated string that you can supply to provide a  
  1161. textual description of the sound.  The size of the info field is set  
  1162. when the structure is created and thereafter can't be enlarged.  It's  
  1163. at least four bytes long (even if it's unused).
  1164.  
  1165.  
  1166.  
  1167.  
  1168.  
  1169. Format Codes
  1170.  
  1171. A sound's format is represented as a positive 32-bit integer.  NeXT  
  1172. reserves the integers 0 through 255; you can define your own format  
  1173. and represent it with an integer greater than 255.  Most of the  
  1174. formats defined by NeXT describe the amplitude quantization of  
  1175. sampled sound data:
  1176.  
  1177. Value   Code    Format 
  1178.  
  1179. 0       SND_FORMAT_UNSPECIFIED  unspecified format 
  1180. 1       SND_FORMAT_MULAW_8      8-bit mu-law samples
  1181. 2       SND_FORMAT_LINEAR_8     8-bit linear samples
  1182. 3       SND_FORMAT_LINEAR_16    16-bit linear samples
  1183. 4       SND_FORMAT_LINEAR_24    24-bit linear samples
  1184. 5       SND_FORMAT_LINEAR_32    32-bit linear samples
  1185. 6       SND_FORMAT_FLOAT        floating-point samples
  1186. 7       SND_FORMAT_DOUBLE       double-precision float samples
  1187. 8       SND_FORMAT_INDIRECT     fragmented sampled data
  1188. 9       SND_FORMAT_NESTED       ?
  1189. 10      SND_FORMAT_DSP_CORE     DSP program
  1190. 11      SND_FORMAT_DSP_DATA_8   8-bit fixed-point samples
  1191. 12      SND_FORMAT_DSP_DATA_16  16-bit fixed-point samples
  1192. 13      SND_FORMAT_DSP_DATA_24  24-bit fixed-point samples
  1193. 14      SND_FORMAT_DSP_DATA_32  32-bit fixed-point samples
  1194. 15      ?
  1195. 16      SND_FORMAT_DISPLAY      non-audio display data
  1196. 17      SND_FORMAT_MULAW_SQUELCH        ?
  1197. 18      SND_FORMAT_EMPHASIZED   16-bit linear with emphasis
  1198. 19      SND_FORMAT_COMPRESSED   16-bit linear with compression
  1199. 20      SND_FORMAT_COMPRESSED_EMPHASIZED        A combination of the two above
  1200. 21      SND_FORMAT_DSP_COMMANDS Music Kit DSP commands
  1201. 22      SND_FORMAT_DSP_COMMANDS_SAMPLES         ?
  1202. [Some new ones supported by Sun.  This is all I currently know. --GvR]
  1203. 23      SND_FORMAT_ADPCM_G721
  1204. 24      SND_FORMAT_ADPCM_G722
  1205. 25      SND_FORMAT_ADPCM_G723_3
  1206. 26      SND_FORMAT_ADPCM_G723_5
  1207. 27      SND_FORMAT_ALAW_8
  1208.  
  1209.  
  1210. Most formats identify different sizes and types of  
  1211. sampled data.  Some deserve special note:  
  1212.  
  1213.  
  1214. --      SND_FORMAT_DSP_CORE format contains data that represents a  
  1215. loadable DSP core program.  Sounds in this format are required by the  
  1216. SNDBootDSP() and SNDRunDSP() functions.  You create a  
  1217. SND_FORMAT_DSP_CORE sound by reading a DSP load file (extension  
  1218. ".lod") with the SNDReadDSPfile() function.
  1219.  
  1220. --      SND_FORMAT_DSP_COMMANDS is used to distinguish sounds that  
  1221. contain DSP commands created by the Music Kit.  Sounds in this format  
  1222. can only be created through the Music Kit's Orchestra class, but can  
  1223. be played back through the SNDStartPlaying() function.
  1224.  
  1225. --      SND_FORMAT_DISPLAY format is used by the Sound Kit's  
  1226. SoundView class.  Such sounds can't be played.  
  1227.  
  1228.  
  1229. --      SND_FORMAT_INDIRECT indicates data that has become  
  1230. fragmented, as described in a separate section, below.  
  1231.  
  1232.  
  1233. --      SND_FORMAT_UNSPECIFIED is used for unrecognized formats.
  1234.  
  1235.  
  1236.  
  1237.  
  1238.  
  1239. Fragmented Sound Data
  1240.  
  1241. Sound data is usually stored in a contiguous block of memory.   
  1242. However, when sampled sound data is edited (such that a portion of  
  1243. the sound is deleted or a portion inserted), the data may become  
  1244. discontiguous, or fragmented.  Each fragment of data is given its own  
  1245. SNDSoundStruct header; thus, each fragment becomes a separate  
  1246. SNDSoundStruct structure.  The addresses of these new structures are  
  1247. collected into a contiguous, NULL-terminated block; the dataLocation  
  1248. field of the original SNDSoundStruct is set to the address of this  
  1249. block, while the original format, sampling rate, and channel count  
  1250. are copied into the new SNDSoundStructs.  
  1251.  
  1252.  
  1253. Fragmentation serves one purpose:  It avoids the high cost of moving  
  1254. data when the sound is edited.  Playback of a fragmented sound is  
  1255. transparent-you never need to know whether the sound is fragmented  
  1256. before playing it.  However, playback of a heavily fragmented sound  
  1257. is less efficient than that of a contiguous sound.  The  
  1258. SNDCompactSamples() C function can be used to compact fragmented  
  1259. sound data.
  1260.  
  1261. Sampled sound data is naturally unfragmented.  A sound that's freshly  
  1262. recorded or retrieved from a soundfile, the Mach-O segment, or the  
  1263. pasteboard won't be fragmented.  Keep in mind that only sampled data  
  1264. can become fragmented.
  1265.  
  1266.  
  1267.  
  1268. _________________________
  1269. >From mentor.cc.purdue.edu!purdue!decwrl!ucbvax!ziploc!eps Wed Apr  4  
  1270. 23:56:23 EST 1990
  1271. Article 5779 of comp.sys.next:
  1272. Path: mentor.cc.purdue.edu!purdue!decwrl!ucbvax!ziploc!eps
  1273. >From: eps@toaster.SFSU.EDU (Eric P. Scott)
  1274. Newsgroups: comp.sys.next
  1275. Subject: Re: Format of NeXT sndfile headers?
  1276. Message-ID: <445@toaster.SFSU.EDU>
  1277. Date: 31 Mar 90 21:36:17 GMT
  1278. References: <14978@phoenix.Princeton.EDU>
  1279. Reply-To: eps@cs.SFSU.EDU (Eric P. Scott)
  1280. Organization: San Francisco State University
  1281. Lines: 42
  1282.  
  1283. In article <14978@phoenix.Princeton.EDU>
  1284.         bskendig@phoenix.Princeton.EDU (Brian Kendig) writes:
  1285. >I'd like to take a program I have that converts Macintosh sound  
  1286. files
  1287. >to NeXT sndfiles and polish it up a bit to go the other direction as
  1288. >well.
  1289.  
  1290. Two people have already submitted programs that do this
  1291. (Christopher Lane and Robert Hood); check the various
  1292. NeXT archive sites.
  1293.  
  1294. >       Could someone please give me the format of a NeXT sndfile
  1295. >header?
  1296.  
  1297. "big-endian"
  1298.         0       1       2       3
  1299.         +-------+-------+-------+-------+
  1300. 0       | 0x2e  | 0x73  | 0x6e  | 0x64  |       "magic" number
  1301.         +-------+-------+-------+-------+
  1302. 4       |                               |       data location
  1303.         +-------+-------+-------+-------+
  1304. 8       |                               |       data size
  1305.         +-------+-------+-------+-------+
  1306. 12      |                               |       data format (enum)
  1307.         +-------+-------+-------+-------+
  1308. 16      |                               |       sampling rate (int)
  1309.         +-------+-------+-------+-------+
  1310. 20      |                               |       channel count
  1311.         +-------+-------+-------+-------+
  1312. 24      |       |       |       |       |       (optional) info  
  1313. string
  1314.  
  1315. 28 = minimum value for data location
  1316.  
  1317. data format values can be found in /usr/include/sound/soundstruct.h
  1318.  
  1319. Most common combinations:
  1320.  
  1321.          sampling  channel    data
  1322.              rate    count  format              
  1323. voice file   8012        1       1 =  8-bit mu-law
  1324. system beep 22050        2       3 = 16-bit linear
  1325. CD-quality  44100        2       3 = 16-bit linear
  1326.  
  1327. ------------------------------------------------------------------------
  1328. IFF/8SVX Format
  1329. ---------------
  1330.  
  1331. Newsgroups: alt.binaries.sounds.d,alt.sex.sounds
  1332. Subject: Format of the IFF header (Amiga sounds)
  1333. Message-ID: <2509@tardis.Tymnet.COM>
  1334. From: jms@tardis.Tymnet.COM (Joe Smith)
  1335. Date: 23 Oct 91 23:54:38 GMT
  1336. Followup-To: alt.binaries.sounds.d
  1337. Organization: BT North America (Tymnet)
  1338.  
  1339. The first 12 bytes of an IFF file are used to distinguish between an Amiga
  1340. picture (FORM-ILBM), an Amiga sound sample (FORM-8SVX), or other file
  1341. conforming to the IFF specification.  The middle 4 bytes is the count of
  1342. bytes that follow the "FORM" and byte count longwords.  (Numbers are stored
  1343. in M68000 form, high order byte first.)
  1344.  
  1345.                 ------------------------------------------
  1346.  
  1347. FutureSound audio file, 15000 samples at 10.000KHz, file is 15048 bytes long.
  1348.  
  1349. 0000: 464F524D 00003AC0 38535658 56484452    FORM..:.8SVXVHDR
  1350.       F O R M     15040 8 S V X  V H D R
  1351. 0010: 00000014 00003A98 00000000 00000000    ......:.........
  1352.             20    15000        0        0
  1353. 0020: 27100100 00010000 424F4459 00003A98    '.......BODY..:.
  1354.      10000 1 0    1.0   B O D Y     15000
  1355.  
  1356. 0000000..03 = "FORM", identifies this as an IFF format file.
  1357. FORM+00..03 (ULONG) = number of bytes that follow.  (Unsigned long int.)
  1358. FORM+03..07 = "8SVX", identifies this as an 8-bit sampled voice.
  1359.  
  1360. ????+00..03 = "VHDR", Voice8Header, describes the parameters for the BODY.
  1361. VHDR+00..03 (ULONG) = number of bytes to follow. 
  1362. VHDR+04..07 (ULONG) = samples in the high octave 1-shot part.
  1363. VHDR+08..0B (ULONG) = samples in the high octave repeat part.
  1364. VHDR+0C..0F (ULONG) = samples per cycle in high octave (if repeating), else 0.
  1365. VHDR+10..11 (UWORD) = samples per second.  (Unsigned 16-bit quantity.)
  1366. VHDR+12     (UBYTE) = number of octaves of waveforms in sample.
  1367. VHDR+13     (UBYTE) = data compression (0=none, 1=Fibonacci-delta encoding).
  1368. VHDR+14..17 (FIXED) = volume.  (The number 65536 means 1.0 or full volume.)
  1369.  
  1370. ????+00..03 = "BODY", identifies the start of the audio data.
  1371. BODY+00..03 (ULONG) = number of bytes to follow.
  1372. BODY+04..NNNNN      = Data, signed bytes, from -128 to +127.
  1373.  
  1374. 0030: 04030201 02030303 04050605 05060605
  1375. 0040: 06080806 07060505 04020202 01FF0000
  1376. 0050: 00000000 FF00FFFF FFFEFDFD FDFEFFFF
  1377. 0060: FDFDFF00 00FFFFFF 00000000 00FFFF00
  1378. 0070: 00000000 00FF0000 00FFFEFF 00000000
  1379. 0080: 00010000 000101FF FF0000FE FEFFFFFE
  1380. 0090: FDFDFEFD FDFFFFFC FDFEFDFD FEFFFEFE
  1381. 00A0: FFFEFEFE FEFEFEFF FFFFFEFF 00FFFF01
  1382.  
  1383. This small section of the audio sample shows the number ranging from -5 (0xFD)
  1384. to +8 (0x08).  Warning: Do not assume that the BODY starts 48 bytes into the
  1385. file.  In addition to "VHDR", chunks labeled "NAME", "AUTH", "ANNO", or 
  1386. "(c) " may be present, and may be in any order.  You will have to check the
  1387. byte count in each chunk to determine how many bytes to skip.
  1388.  
  1389. ------------------------------------------------------------------------
  1390. Playing sound on a PC
  1391. ---------------------
  1392.  
  1393. From: Eric A Rasmussen
  1394.  
  1395. Any turbo PC (8088 at 8 Mhz or greater)/286/386/486/etc. can produce a quality
  1396. playback of single channel 8 bit sounds on the internal (1 bit, 1 channel)
  1397. speaker by utilizing Pulse-Width-Modulation, which toggles the speaker faster
  1398. than it can physically move to simulate positions between fully on and fully
  1399. off.  There are several PD programs of this nature that I know of:
  1400.  
  1401. REMAC  - Plays MAC format sound files.  Files on the Macintosh, at least the
  1402.          sound files that I've ripped apart, seem to contain 3 parts.  The
  1403.          first two are info like what the file icon looks like and other
  1404.          header type info.  The third part contains the raw sample data, and
  1405.          it is this portion of the file which is saved to a seperate file,
  1406.          often named with the .snd extension by PC users.  Personally, I like
  1407.          to name the files .s1, .s2, .s3, or .s4 to indicate the sampling rate
  1408.          of the file. (-s# is how to specify the playback rate in REMAC.)
  1409.          REMAC provides playback rates of 5550hz, 7333hz, 11 khz, & 22 khz.
  1410. REMAC2 - Same as REMAC, but sounds better on higher speed machines.
  1411. REPLAY - Basically same as REMAC, but for playback of Atari ST sounds. 
  1412.          Apparently, the Atari has two sound formats, one of which sounds like
  1413.          garbage if played by REMAC or REPLAY in the incorrect mode.  The
  1414.          other file format works fine with REMAC and so appears to be 'normal'
  1415.          unsigned 8-bit data.  REPLAY provides playback rates of 11.5 khz,
  1416.          12.5 khz, 14 khz, 16 khz, 18.5 khz, 22khz, & 27 khz.
  1417.  
  1418. These three programs are all by the same author, Richard E. Zobell who does
  1419. not have an internet mail address to my knowledge, but does have a GEnie email
  1420. address of R.ZOBELL. 
  1421.  
  1422. Additionally, there are various stand-alone demos which use the internal
  1423. speaker, of which there is one called mushroom which plays a 30 second
  1424. advertising jingle for magic mushroom room deoderizers which is pretty
  1425. humerous.  I've used this player to playback samples that I ripped out of the
  1426. commercial game program Mean Streets, which uses something they call RealSound
  1427. (tm) to playback digital samples on the internal speaker. (Of course, I only do
  1428. this on my own system, and since I own the game, I see no problems with it.)
  1429.  
  1430. For owners of 8 Mhz 286's and above, the option to play 4 channel 8 bit sounds
  1431. (with decent quality) on the internal speaker is also a reality.  Quite a
  1432. number of PD programs exist to do this, including, but not limited to:
  1433.  
  1434. ModEdit, ModPlay, ScreamTracker, STM, Star Trekker, Tetra, and probably a few
  1435. more.  
  1436.  
  1437. All these programs basically make use of various sound formats used by the
  1438. Amiga line of computers.  These include .stm files, .mod files
  1439. [a.k.a. mod. files], and .nst files [really the same hing].  Also,
  1440. these programs pretty much all have the option to playback the 
  1441. sound to add-on hardware such as the SoundBlaster card, the Covox series of
  1442. devices, and also to direct the data to either one or two (for stereo)
  1443. parallel ports, which you could attach your own D/A's to.  (From what I have
  1444. seen, the Covox is basically an small amplified speaker with a D/A which plugs
  1445. into the parallel port.  This sounds very similiar to the Disney Sound System
  1446. (DSS) which people have been talking about recently.)  
  1447.  
  1448. ------------------------------------------------------------------------
  1449. The EA-IFF-85 documentation
  1450. ---------------------------
  1451.  
  1452. From: dgc3@midway.uchicago.edu
  1453.  
  1454. As promised, here's an ftp location for the EA-IFF-85 documentation.  It's
  1455. the November 1988 release as revised by Commodore (the last public release),
  1456. with specifications for IFF FORMs for graphics, sound, formatted text, and
  1457. more.  IFF FORMS now exist for other media, including structured drawing, and
  1458. new documentation is now available only from Commodore.
  1459.  
  1460. The documentation is at grind.isca.uiowa.edu [128.255.19.233], in the
  1461. directory /amiga/f1/ff185.  The complete file list is as follows:
  1462.  
  1463. DOCUMENTS.zoo    
  1464. EXAMPLES.zoo     
  1465. EXECUTABLE.zoo   
  1466. INCLUDE.zoo      
  1467. LINKER_INFO.zoo  
  1468. OBJECT.zoo       
  1469. SOURCE.zoo       
  1470. TP_IFF_Specs.zoo 
  1471.  
  1472. All files except DOCUMENTS.zoo are Amiga-specific, but may be used as a basis
  1473. for conversion to other platforms.  Well, I take that tentatively back.  I
  1474. don't know what TP_IFF_Specs.zoo contains, so it might be non-Amiga-specific.
  1475.  
  1476. ------------------------------------------------------------------------
  1477. US Federal Standard 1016 availability
  1478. -------------------------------------
  1479.  
  1480. From: Joe Campbell  N3JBC  jpcampb@afterlife.ncsc.mil  74040.305@compuserve.com
  1481.  
  1482. The U.S. DoD's Federal-Standard-1016 4800 bps code excited linear prediction
  1483. voice coder version 3.2 (CELP 3.2) Fortran and C simulation source codes are
  1484. now available for worldwide distribution at no charge (on DOS diskettes,
  1485. but configured to compile on Sun SPARC stations) from:
  1486.  
  1487. Bob Fenichel
  1488. National Communications System
  1489. Washington, D.C.  20305
  1490. 1-703-692-2124
  1491. 1-703-746-4960 (fax)
  1492.  
  1493. In addition to the source codes, example input and processed speech files
  1494. are included along with a technical information bulletin to assist in
  1495. implementation of FS-1016 CELP.  (An anonymous ftp site is being considered
  1496. for future releases.)
  1497.  
  1498. Copies of the FS-1016 document are available for $2.50 each from:
  1499.  
  1500. GSA Rm 6654
  1501. 7th & D St SW
  1502. Washington, D.C.  20407
  1503. 1-202-708-9205
  1504.  
  1505. The following articles describe the Federal-Standard-1016 4.8-kbps CELP
  1506. coder (it's unnecessary to read more than one):
  1507.  
  1508. Campbell, Joseph P. Jr., Thomas E. Tremain and Vanoy C. Welch,
  1509. "The Federal Standard 1016 4800 bps CELP Voice Coder," Digital Signal
  1510. Processing, Academic Press, 1991, Vol. 1, No. 3, p. 145-155.
  1511.  
  1512. Campbell, Joseph P. Jr., Thomas E. Tremain and Vanoy C. Welch,
  1513. "The DoD 4.8 kbps Standard (Proposed Federal Standard 1016),"
  1514. in Advances in Speech Coding, ed. Atal, Cuperman and Gersho,
  1515. Kluwer Academic Publishers, 1991, Chapter 12, p. 121-133.
  1516.  
  1517. Campbell, Joseph P. Jr., Thomas E. Tremain and Vanoy C. Welch, "The
  1518. Proposed Federal Standard 1016 4800 bps Voice Coder:  CELP," Speech
  1519. Technology Magazine, April/May 1990, p. 58-64.
  1520.  
  1521. For U.S. FED-STD-1016 (4800 bps CELP) _realtime_ DSP code
  1522. and information about products using this code, contact:
  1523.  
  1524. John DellaMorte
  1525. DSP Software Engineering
  1526. 165 Middlesex Tpk, Suite 206
  1527. Bedford, MA  01730
  1528. 1-617-275-3733
  1529. 1-617-275-4323 (fax)
  1530. dspse.bedford@channel1.com
  1531.  
  1532. DSP Software Engineering's code can run on a DSP Research's Tiger 30 board
  1533. (a PC board with a TMS320C3x and analog interface suited to development work)
  1534. or on Intellibit's AE2000 TMS320C31 based 3" by 2.5" card.
  1535.  
  1536. DSP Research                Intellibit
  1537. 1095 E. Duane Ave.          P.O. Box 9785
  1538. Sunnyvale, CA  94086        McLean, VA  22102-0785
  1539. (408)773-1042               (703)442-4781
  1540. (408)736-3451 (fax)         (703)442-4784 (fax)
  1541.  
  1542. From: tobiasr@monolith.lrmsc.loral.com (Richard Tobias )
  1543.  
  1544. For U.S. FED-STD-1016 (4800 bps CELP) _realtime_ DSP code and
  1545. information about products using this code using the AT&T DSP32C and
  1546. AT&T DSP3210, contact:
  1547.  
  1548. White Eagle Systems Technology, Inc.
  1549. 1123 Queensbridge Way
  1550. San Jose, CA 95120
  1551. (408) 997-2706
  1552. (408) 997-3584 (fax)
  1553. rjjt@netcom.com
  1554.  
  1555. Newsgroups: comp.dsp
  1556. From: bae@hplsdrn.col.hp.com (Bruce Erickson)
  1557. Subject: Re: FTP site for CELP audio compression source?
  1558.  
  1559. In comp.dsp (subj: FTP site for CELP audio compression source?), Joe
  1560. Campbell writes:
  1561. > I would like to mention that a document, that is a vital part of the CELP
  1562. > release package, is not available in electronic form.  Therefore, I urge
  1563. > anyone who is seriously interested in this coder to obtain this document:
  1564. >  Details to Assist in Implementation of Federal Standard 1016 CELP.
  1565. >  National Communications System, Office of Technology & Standards, 1992.
  1566. >  Technical Information Bulletin 92-1.
  1567. [Available for free from Bob Fenichel above --GvR]
  1568.  
  1569. I would also like to mention that when Bob gave me permission to put the
  1570. CELP disks on wsmr-simutel he asked for people who fetch them to let
  1571. him know that they have them.  
  1572.  
  1573. So if you grab the sources -- from whatever source -- please give him
  1574. a call or send him USmail.
  1575.  
  1576. I am still waiting for wsmr-simutel to let me know how to upload the CELP
  1577. disks -- I will be sure to post here & elsewhere when I upload them!
  1578.  
  1579.                      - Bruce Erickson
  1580.                      bae@col.hp.com
  1581.  
  1582. ------------------------------------------------------------------------
  1583. Creative Voice (VOC) file format
  1584. --------------------------------
  1585.  
  1586. From: galt@dsd.es.com
  1587.  
  1588. (byte numbers are hex!)
  1589.  
  1590.     HEADER (bytes 00-19)
  1591.     Series of DATA BLOCKS (bytes 1A+) [Must end w/ Terminator Block]
  1592.  
  1593. - ---------------------------------------------------------------
  1594.  
  1595. HEADER:
  1596. =======
  1597.      byte #     Description
  1598.      ------     ------------------------------------------
  1599.      00-12      "Creative Voice File"
  1600.      13         1A (eof to abort printing of file)
  1601.      14-15      Offset of first datablock in .voc file (std 1A 00
  1602.                 in Intel Notation)
  1603.      16-17      Version number (minor,major) (VOC-HDR puts 0A 01)
  1604.      18-19      2's Comp of Ver. # + 1234h (VOC-HDR puts 29 11)
  1605.  
  1606. - ---------------------------------------------------------------
  1607.  
  1608. DATA BLOCK:
  1609. ===========
  1610.  
  1611.    Data Block:  TYPE(1-byte), SIZE(3-bytes), INFO(0+ bytes)
  1612.    NOTE: Terminator Block is an exception -- it has only the TYPE byte.
  1613.  
  1614.       TYPE   Description     Size (3-byte int)   Info
  1615.       ----   -----------     -----------------   -----------------------
  1616.       00     Terminator      (NONE)              (NONE)
  1617.       01     Sound data      2+length of data    *
  1618.       02     Sound continue  length of data      Voice Data
  1619.       03     Silence         3                   **
  1620.       04     Marker          2                   Marker# (2 bytes)
  1621.       05     ASCII           length of string    null terminated string
  1622.       06     Repeat          2                   Count# (2 bytes)
  1623.       07     End repeat      0                   (NONE)
  1624.  
  1625.       *Sound Info Format:       **Silence Info Format:
  1626.        ---------------------      ----------------------------
  1627.        00   Sample Rate           00-01  Length of silence - 1
  1628.        01   Compression Type      02     Sample Rate
  1629.        02+  Voice Data
  1630.  
  1631.  
  1632.   Marker#           -- Driver keeps the most recent marker in a status byte
  1633.   Count#            -- Number of repetitions + 1
  1634.                          Count# may be 1 to FFFE for 0 - FFFD repetitions
  1635.                          or FFFF for endless repetitions
  1636.   Sample Rate       -- SR byte = 256-(1000000/sample_rate)
  1637.   Length of silence -- in units of sampling cycle
  1638.   Compression Type  -- of voice data
  1639.                          8-bits    = 0
  1640.                          4-bits    = 1
  1641.                          2.6-bits  = 2
  1642.                          2-bits    = 3
  1643.                          Multi DAC = 3+(# of channels) [interesting--
  1644.                                        this isn't in the developer's manual]
  1645.  
  1646. ------------------------------------------------------------------------
  1647. RIFF WAVE (.WAV) file format
  1648. ----------------------------
  1649.  
  1650. RIFF is a format by Microsoft and IBM which is similar in spirit and
  1651. functionality as EA-IFF-85, but not compatible (and it's in
  1652. little-endian byte order, of course :-).  WAVE is RIFF's equivalent of
  1653. AIFF, and its inclusion in Microsoft Windows 3.1 has suddenly made it
  1654. important to know about.
  1655.  
  1656. Rob Ryan was kind enough to send me a description of the RIFF format.
  1657. Unfortunately, it is too big to include here (27 k), but I've made it
  1658. available for anonymous ftp as ftp.cwi.nl:/pub/audio/RIFF-format.
  1659.  
  1660. And here's a pointer to the official description from Matt Saettler,
  1661. Microsoft Multimedia:
  1662.  
  1663. "The complete definition of the WAVE file format as defined by
  1664. IBM/Microsoft is available for anon. FTP from ftp.uu.net in the
  1665. vendor/microsoft/multimedia directory."
  1666.  
  1667. (Rob Ryan's version may actually be an extract from one of the files
  1668. stored there.)
  1669.  
  1670. ------------------------------------------------------------------------
  1671. U-LAW and A-LAW definitions
  1672. ---------------------------
  1673.  
  1674. [Adapted from information provided by duggan@cc.gatech.edu (Rick
  1675. Duggan) and davep@zenobia.phys.unsw.EDU.AU (David Perry)]
  1676.  
  1677. u-LAW (really mu-LAW) is
  1678.  
  1679.           sgn(m)   (     |m |)       |m |
  1680.    y=    ------- ln( 1+ u|--|)       |--| =< 1
  1681.          ln(1+u)   (     |mp|)       |mp|         
  1682.  
  1683. A-LAW is
  1684.  
  1685.      |     A    (m )                 |m |    1
  1686.      |  ------- (--)                 |--| =< - 
  1687.      |  1+ln A  (mp)                 |mp|    A     
  1688.    y=|
  1689.      | sgn(m) (        |m |)    1    |m |
  1690.      | ------ ( 1+ ln A|--|)    - =< |--| =< 1
  1691.      | 1+ln A (        |mp|)    A    |mp|         
  1692.  
  1693. Values of u=100 and 255, A=87.6, mp is the Peak message value, m is
  1694. the current quantised message value.  (The formulae get simpler if you
  1695. substitute x for m/mp and sgn(x) for sgn(m); then -1 <= x <= 1.)
  1696.  
  1697. Converting from u-LAW to A-LAW is in a sense "lossy" since there are
  1698. quantizing errors introduced in the conversion.
  1699.  
  1700. "..the u-LAW used in North America and Japan, and the
  1701. A-LAW used in Europe and the rest of the world and
  1702. international routes.."
  1703.  
  1704. References:
  1705.  
  1706. Modern Digital and Analog Communication Systems, B.P.Lathi., 2nd ed.
  1707. ISBN 0-03-027933-X
  1708.  
  1709. Transmission Systems for Communications
  1710. Fifth Edition
  1711. by Members of the Technical Staff at Bell Telephone Laboratories
  1712. Bell Telephone Laboratories, Incorporated
  1713. Copyright 1959, 1964, 1970, 1982
  1714.  
  1715. ------------------------------------------------------------------------
  1716. AVR File Format
  1717. ---------------
  1718.  
  1719. From: hyc@hanauma.Jpl.Nasa.Gov (Howard Chu)
  1720.  
  1721. A lot of PD software exists to play Mac .snd files on the ST. One other
  1722. format that seems pretty popular (used by a number of commercial packages)
  1723. is the AVR format (from Audio Visual Research). This format has a 128 byte
  1724. header that looks like this:
  1725.  
  1726.         char magic[4]="2BIT";
  1727.         char name[8];           /* null-padded sample name */
  1728.         short mono;             /* 0 = mono, 0xffff = stereo */
  1729.         short rez;              /* 8 = 8 bit, 16 = 16 bit */
  1730.         short sign;             /* 0 = unsigned, 0xffff = signed */
  1731.         short loop;             /* 0 = no loop, 0xffff = looping sample */
  1732.         short midi;             /* 0xffff = no MIDI note assigned,
  1733.                                    0xffXX = single key note assignment
  1734.                                    0xLLHH = key split, low/hi note */
  1735.         long rate;              /* sample frequency in hertz */
  1736.         long size;              /* sample length in bytes or words (see rez) */
  1737.         long lbeg;              /* offset to start of loop in bytes or words.
  1738.                                    set to zero if unused. */
  1739.         long lend;              /* offset to end of loop in bytes or words.
  1740.                                    set to sample length if unused. */
  1741.         short res1;             /* Reserved, MIDI keyboard split */
  1742.         short res2;             /* Reserved, sample compression */
  1743.         short res3;             /* Reserved */
  1744.         char ext[20];           /* Additional filename space, used
  1745.                                    if (name[7] != 0) */
  1746.         char user[64];          /* User defined. Typically ASCII message. */
  1747.  
  1748. -----------------------------------------------------------------------
  1749. The Amiga MOD Format
  1750. --------------------
  1751.  
  1752. From: norlin@mailhost.ecn.uoknor.edu (Norman Lin)
  1753.  
  1754. MOD files are music files containing 2 parts:
  1755.  
  1756. (1) a bank of digitized samples
  1757. (2) sequencing information describing how and when to play the samples
  1758.  
  1759. MOD files originated on the Amiga, but because of their flexibility
  1760. and the extremely large number of MOD files available, MOD players
  1761. are now available for a variety of machines (IBM PC, Mac, Sparc
  1762. Station, etc.)
  1763.  
  1764. The samples in a MOD file are raw, 8 bit, signed, headerless, linear
  1765. digital data.  There may be up to 31 distinct samples in a MOD file,
  1766. each with a length of up to 128K (though most are much smaller; say,
  1767. 10K - 60K).  An older MOD format only allowed for up to 15 samples in
  1768. a MOD file; you don't see many of these anymore.  There is no standard
  1769. sampling rate for these samples.  [But see below.]
  1770.  
  1771. The sequencing information in a MOD file contains 4 tracks of
  1772. information describing which, when, for how long, and at what frequency
  1773. samples should be played.  This means that a MOD file can have up
  1774. to 31 distinct (digitized) instrument sounds, with up to 4 playing
  1775. simultaneously at any given point.  This allows a wide variety
  1776. of orchestrational possibilities, including use of voice samples
  1777. or creation of one's own instruments (with appropriate sampling
  1778. hardware/software).  The ability to use one's own samples as instruments
  1779. is a flexibility that other music files/formats do not share, and
  1780. is one of the reasons MOD files are so popular, numerous, and diverse.
  1781.  
  1782. 15 instrument MODs, as noted above, are somewhat older than 31
  1783. instrument MODs and are not (at least not by me) seen very often
  1784. anymore.  Their format is identical to that of 31 instrument MODs
  1785. except:
  1786.  
  1787. (1) Since there are only 15 samples, the information for the last (15th)
  1788.     sample starts at byte 440 and goes through byte 469.
  1789. (2) The songlength is at byte 470 (contrast with byte 950 in 31 instrument
  1790.     MOD)
  1791. (3) Byte 471 appears to be ignored, but has been observed to be 127.
  1792.     (Sorry, this is from observation only)
  1793. (4) Byte 472 begins the pattern sequence table (contrast with byte 952
  1794.     in a 31 instrument MOD)
  1795. (5) Patterns start at byte 600 (contrast with byte 1084 in 31 instrument MOD)
  1796.  
  1797. "ProTracker," an Amiga MOD file creator/editor, is available for ftp
  1798. everywhere as pt??.lzh.
  1799.  
  1800. From: Apollo Wong <apollo@ee.ualberta.ca>
  1801.  
  1802. From: M.J.H.Cox@bradford.ac.uk (Mark Cox)
  1803. Newsgroups: alt.sb.programmer
  1804. Subject: Re: Format for MOD files...
  1805. Message-ID: <1992Mar18.103608.4061@bradford.ac.uk>
  1806. Date: 18 Mar 92 10:36:08 GMT
  1807. Organization: University of Bradford, UK
  1808.  
  1809. wdc50@DUTS.ccc.amdahl.com (Winthrop D Chan) writes:
  1810. >I'd like to know if anyone has a reference document on the format of the
  1811. >Amiga Sound/NoiseTracker (MOD) files. The author of Modplay said he was going
  1812. >to release such a document sometime last year, but he never did. If anyone
  1813.  
  1814. I found this one, which covers it better than I can explain it - if you
  1815. use this in conjunction with the documentation that comes with Norman
  1816. Lin's Modedit program it should pretty much cover it.
  1817.  
  1818. Mark J Cox
  1819.  
  1820. /***********************************************************************
  1821.  
  1822. Protracker 1.1B Song/Module Format:
  1823. -----------------------------------
  1824.  
  1825. Offset  Bytes  Description
  1826. ------  -----  -----------
  1827.    0     20    Songname. Remember to put trailing null bytes at the end...
  1828.  
  1829. Information for sample 1-31:
  1830.  
  1831. Offset  Bytes  Description
  1832. ------  -----  -----------
  1833.   20     22    Samplename for sample 1. Pad with null bytes.
  1834.   42      2    Samplelength for sample 1. Stored as number of words.
  1835.                Multiply by two to get real sample length in bytes.
  1836.   44      1    Lower four bits are the finetune value, stored as a signed
  1837.                four bit number. The upper four bits are not used, and
  1838.                should be set to zero.
  1839.                Value:  Finetune:
  1840.                  0        0
  1841.                  1       +1
  1842.                  2       +2
  1843.                  3       +3
  1844.                  4       +4
  1845.                  5       +5
  1846.                  6       +6
  1847.                  7       +7
  1848.                  8       -8
  1849.                  9       -7
  1850.                  A       -6
  1851.                  B       -5
  1852.                  C       -4
  1853.                  D       -3
  1854.                  E       -2
  1855.                  F       -1
  1856.  
  1857.   45      1    Volume for sample 1. Range is $00-$40, or 0-64 decimal.
  1858.   46      2    Repeat point for sample 1. Stored as number of words offset
  1859.                from start of sample. Multiply by two to get offset in bytes.
  1860.   48      2    Repeat Length for sample 1. Stored as number of words in
  1861.                loop. Multiply by two to get replen in bytes.
  1862.  
  1863. Information for the next 30 samples starts here. It's just like the info for
  1864. sample 1.
  1865.  
  1866. Offset  Bytes  Description
  1867. ------  -----  -----------
  1868.   50     30    Sample 2...
  1869.   80     30    Sample 3...
  1870.    .
  1871.    .
  1872.    .
  1873.  890     30    Sample 30...
  1874.  920     30    Sample 31...
  1875.  
  1876. Offset  Bytes  Description
  1877. ------  -----  -----------
  1878.  950      1    Songlength. Range is 1-128.
  1879.  951      1    Well... this little byte here is set to 127, so that old
  1880.                trackers will search through all patterns when loading.
  1881.                Noisetracker uses this byte for restart, but we don't.
  1882.  952    128    Song positions 0-127. Each hold a number from 0-63 that
  1883.                tells the tracker what pattern to play at that position.
  1884. 1080      4    The four letters "M.K." - This is something Mahoney & Kaktus
  1885.                inserted when they increased the number of samples from
  1886.                15 to 31. If it's not there, the module/song uses 15 samples
  1887.                or the text has been removed to make the module harder to
  1888.                rip. Startrekker puts "FLT4" or "FLT8" there instead.
  1889.  
  1890. Offset  Bytes  Description
  1891. ------  -----  -----------
  1892. 1084    1024   Data for pattern 00.
  1893.    .
  1894.    .
  1895.    .
  1896. xxxx  Number of patterns stored is equal to the highest patternnumber
  1897.       in the song position table (at offset 952-1079).
  1898.  
  1899. Each note is stored as 4 bytes, and all four notes at each position in
  1900. the pattern are stored after each other.
  1901.  
  1902. 00 -  chan1  chan2  chan3  chan4
  1903. 01 -  chan1  chan2  chan3  chan4
  1904. 02 -  chan1  chan2  chan3  chan4
  1905. etc.
  1906.  
  1907. Info for each note:
  1908.  
  1909.  _____byte 1_____   byte2_    _____byte 3_____   byte4_
  1910. /                \ /      \  /                \ /      \
  1911. 0000          0000-00000000  0000          0000-00000000
  1912.  
  1913. Upper four    12 bits for    Lower four    Effect command.
  1914. bits of sam-  note period.   bits of sam-
  1915. ple number.                  ple number.
  1916.  
  1917. Periodtable for Tuning 0, Normal
  1918.   C-1 to B-1 : 856,808,762,720,678,640,604,570,538,508,480,453
  1919.   C-2 to B-2 : 428,404,381,360,339,320,302,285,269,254,240,226
  1920.   C-3 to B-3 : 214,202,190,180,170,160,151,143,135,127,120,113
  1921.  
  1922. To determine what note to show, scan through the table until you find
  1923. the same period as the one stored in byte 1-2. Use the index to look
  1924. up in a notenames table.
  1925.  
  1926. This is the data stored in a normal song. A packed song starts with the
  1927. four letters "PACK", but i don't know how the song is packed: You can
  1928. get the source code for the cruncher/decruncher from us if you need it,
  1929. but I don't understand it; I've just ripped it from another tracker...
  1930.  
  1931. In a module, all the samples are stored right after the patterndata.
  1932. To determine where a sample starts and stops, you use the sampleinfo
  1933. structures in the beginning of the file (from offset 20). Take a look
  1934. at the mt_init routine in the playroutine, and you'll see just how it
  1935. is done.
  1936.  
  1937. Lars "ZAP" Hamre/Amiga Freelancers
  1938.  
  1939. ***********************************************************************/
  1940.  
  1941. -- 
  1942. Mark J Cox -----
  1943. Bradford, UK ---
  1944.  
  1945.  
  1946. PS: A file with even *much* more info on MOD files, compiled by Lars
  1947. Hamre, is available from ftp.cwi.nl:/pub/audio/MOD-info.  Enjoy!
  1948.  
  1949.  
  1950. FTP sites for MODs and MOD players
  1951. ----------------------------------
  1952.  
  1953. Subject: MODS AND PLAYERS!! **READ** info/where to get them
  1954. From: cjohnson@tartarus.uwa.edu.au (Christopher Johnson)
  1955. Newsgroups: alt.binaries.sounds.d
  1956. Message-ID: <1h32ivINNglu@uniwa.uwa.edu.au>
  1957. Date: 21 Dec 92 00:19:43 GMT
  1958. Organization: The University of Western Australia
  1959.  
  1960. Hello world,
  1961.  
  1962. For all those asking, here is where to get those mod players and mods.
  1963.  
  1964. SNAKE.MCS.KENT.EDU is the best site for general stuff.  look in /pub/SB-Adlib
  1965.  
  1966. Simtel-20 or archie.au(simtel mirror) in <msdos.sound>
  1967.  
  1968. for windows players ftp.cica.indiana.edu in pub/pc/win3/sound
  1969.  
  1970. here is a short list of players
  1971.  
  1972. mp or modplay   BEST OVERALL                    mp219b.zip      
  1973.         simtel and snake
  1974.  
  1975. wowii           best for vga/fast machines      wowii12b.zip    
  1976.         simtel and snake
  1977.  
  1978. trakblaster     best for compatability          trak-something  
  1979.         simtel and snake        two versions, old one for slow
  1980.         machines
  1981.  
  1982. ss              cute display(hifi)              have_sex.arj
  1983.         found on local BBS (western Australia White Ghost)
  1984.  
  1985. superpro player generally good                  ssp.zip or similar
  1986.         found on night owl 7 CD
  1987.  
  1988. player?         cute display(hifi)              player.zip or similar
  1989.         found on night owl 7 CD
  1990.  
  1991. WINDOWS
  1992.  
  1993. Winmod pro      does protracker                 wmp????.zip
  1994.         cica
  1995.  
  1996. winmod          more stable                     winmod12.zip or similar
  1997.         cica
  1998.  
  1999. Hope this helps, e-mail me if you find any more players and I will add them in
  2000. for the next time mod player requests get a
  2001. little out of hand.
  2002.  
  2003. for mods ftp to wuarchive.wustl.edu and go to the amiga music directory
  2004. (pub/amiga/music/ntsb ?????)  that should do you for
  2005. a while
  2006.  
  2007. see you soon
  2008.  
  2009. Chris.
  2010.  
  2011. -----------------------------------------------------------------------
  2012.  
  2013.   Inflating: A3  <to console>
  2014.  
  2015. Archive-name: audio-fmts/diff
  2016. Submitted-by: Guido van Rossum <guido@cwi.nl>
  2017. Version: 3.02
  2018. Last-modified: 11-May-1993
  2019.  
  2020. *** 1.1 1993/03/22 11:30:53
  2021. --- audio.part1 1993/05/11 13:03:48
  2022. ***************
  2023. *** 60,62 ****
  2024.   The entire FAQ is also available by anonymous ftp from ftp.cwi.nl
  2025. ! [192.16.184.180], directory pub/audio, files AudioFormats{part1,part2}.
  2026.   
  2027. --- 60,62 ----
  2028.   The entire FAQ is also available by anonymous ftp from ftp.cwi.nl
  2029. ! [192.16.184.180], directory pub/audio, files AudioFormats.{part1,part2}.
  2030.   
  2031. ***************
  2032. *** 315,322 ****
  2033.   All these machines can play back sound without additional hardware,
  2034. ! although the needed software is not always standard; only the Sun,
  2035. ! NeXT and SGI come with standard sampling hardware (the NeXT only
  2036. ! samples U-LAW at 8000 samples/sec from the built-in microphone port;
  2037. ! you need a separate board for other rates).  (Don't send me details on
  2038.   optional or 3rd party hardware, there is too much and it is really
  2039. ! beyond the scope of this FAQ.)
  2040.   
  2041. --- 315,322 ----
  2042.   All these machines can play back sound without additional hardware,
  2043. ! although the needed software is not always standard; also, some
  2044. ! machines need external hardware to record sound (or to record at
  2045. ! higher quality, like the NeXT, whose built-in sampling hardware only
  2046. ! does 8000 samples/sec in U-LAW).  Please don't send me details on
  2047.   optional or 3rd party hardware, there is too much and it is really
  2048. ! beyond the scope of this FAQ.
  2049.   
  2050. ***************
  2051. *** 325,327 ****
  2052.   In fact, DECsound is given away free with Motif 1.1 and supports the
  2053. ! VAXstation, Sun SPARCstation, DECvoice, and XMedia audio devices.  Sun
  2054.   sound files work without change.  The Alpha systems (DEC 3000 Model
  2055. --- 325,327 ----
  2056.   In fact, DECsound is given away free with Motif 1.1 and supports the
  2057. ! VAXstation, Sun SPARCstation, DECvoice, and DECaudio devices.  Sun
  2058.   sound files work without change.  The Alpha systems (DEC 3000 Model
  2059. ***************
  2060. *** 470,471 ****
  2061. --- 470,480 ----
  2062.   
  2063. + The "IRCAM" sound file system has now been superseded by the so-called
  2064. + "BICSF" (for Berkeley/IRCAM/CARL Sound File system) software release.
  2065. + More recently, there has been an effort at Princeton (Prof. Paul
  2066. + Lansky) and Stanford (Stephen Travis Pope) to standardize several
  2067. + extensions to BICSF.  A description of BICSF and the
  2068. + Princeton/Stanford extensions is available by anonymous ftp from
  2069. + ftp.cwi.nl [192.16.184.180], in directory /pub/audio/BICSF-info.  This
  2070. + file contains further ftp pointers to software.
  2071.   Finally, a somewhat different but popular format are "MOD" files,
  2072. ***************
  2073. *** 736,739 ****
  2074.   A program "playulaw" was posted as part of the "radio 2.0" release
  2075. ! that I posted to several source groups recently; it plays raw U-LAW
  2076. ! files on the Indigo, Indigo2 or Personal IRIS audio hardware.
  2077.   
  2078. --- 745,748 ----
  2079.   A program "playulaw" was posted as part of the "radio 2.0" release
  2080. ! that I posted to several source groups; it plays raw U-LAW files on
  2081. ! the Indigo, Indigo2 or Personal IRIS audio hardware.
  2082.   
  2083. ***************
  2084. *** 749,752 ****
  2085.   
  2086. !         Vaxstation 4000
  2087. !         ---------------
  2088.   
  2089. --- 758,777 ----
  2090.   
  2091. !         Others
  2092. !         ------
  2093. ! Most other UNIX boxes don't have audio hardware and thus can't play
  2094. ! audio data.  This is actually rapidly changing and most new hardware
  2095. ! that hits the market has some form of audio support.  Unfortunately
  2096. ! there is nothing like X11 that provides a portable interface.  Perhaps
  2097. ! DEC CRL's AudioFile system can fill the gap; it is network-transparent
  2098. ! and supports at least Digital RISC systems running Ultrix, Digital
  2099. ! Alpha AXP systems running OSF/1, Sun Microsystems SPARCstations
  2100. ! running SunOS, and SGI Indigos.  The source kit is located at ftp site
  2101. ! crl.dec.com (Internet 192.58.206.2) in /pub/DEC/AF.
  2102. ! Playing audio files on the Vaxstation 4000 (VMS)
  2103. ! ------------------------------------------------
  2104. ! 1) Without DECsound
  2105.   
  2106. ***************
  2107. *** 764,765 ****
  2108. --- 789,804 ----
  2109.   
  2110. + 2) With DECsound (bundled with motif)
  2111. + Just start DECsound by selecting it from the session manager in the 
  2112. + applications menu. (Not there use "@vue$library:sound$vue_startup").
  2113. + Make sure settings; device type (vaxstation 4000) and play settings
  2114. + (headphone jack) are selected.  To play files from the DCL prompt 
  2115. + (handy if you want to play sounds on a remote workstation) set a 
  2116. + symbol up as follows; 
  2117. + PLAY == "$DECSOUND -VOLUME 50 -PLAY"
  2118. + usage;
  2119. + DCL> play sound.au
  2120. + 3) Audio port
  2121.   The external audio port comes with a telephone-jack-like port.   For
  2122. ***************
  2123. *** 768,784 ****
  2124.   (that came with the VaxStation), and plug in a small set of stereo
  2125. ! speakers (the kind you'd plug into a WALKMAN, for example), for more
  2126. ! volume.
  2127. !         Others
  2128. !         ------
  2129. ! Most other UNIX boxes don't have audio hardware and thus can't play
  2130. ! audio data.  This is actually rapidly changing and most new hardware
  2131. ! that hits the market has some form of audio support.  Unfortunately
  2132. ! there is nothing like X11 that provides a portable interface.  Perhaps
  2133. ! DEC CRL's AudioFile system can fill the gap; it is network-transparent
  2134. ! and supports at least Digital RISC systems running Ultrix, Digital
  2135. ! Alpha AXP systems running OSF/1, and Sun Microsystems SPARCstations
  2136. ! running SunOS.  The source kit is located at ftp site crl.dec.com
  2137. ! (Internet 192.58.206.2) in /pub/DEC/AF.
  2138.   
  2139. --- 807,811 ----
  2140.   (that came with the VaxStation), and plug in a small set of stereo
  2141. ! speakers or headphones (the kind you'd plug into a WALKMAN, for 
  2142. ! example), for more volume.  The adapter also has a microphone plug so
  2143. ! that you can record sounds if DECsound is installed.
  2144.   
  2145. ***************
  2146. *** 899,903 ****
  2147.   sound formats, albeit mostly on micros, is "The Sound Site
  2148. ! Newsletter".  Issue 12 appeared in March 1993.  Issues can be ftp'ed
  2149. ! from saffron.inset.com, directory directory pub/rogue/newsletters, or
  2150. ! from ccb.ucsf.edu, Pub/Sound_list/Sound.Newsletters.
  2151.   
  2152. --- 926,932 ----
  2153.   sound formats, albeit mostly on micros, is "The Sound Site
  2154. ! Newsletter".  Issue 12 appeared in March 1993.  This used to be
  2155. ! available by anonymouse ftp from saffron, but I have been informed
  2156. ! that saffron is no longer providing this service.  If you know of a
  2157. ! different site carrying recent issues of the Sound Site newsletter,
  2158. ! please let me know!)
  2159.   
  2160. *** 1.1 1993/03/22 11:30:53
  2161. --- audio.part2 1993/05/11 13:03:54
  2162. ***************
  2163. *** 17,19 ****
  2164.   
  2165. ! Table of contents:
  2166.   
  2167. --- 17,20 ----
  2168.   
  2169. ! Table of contents
  2170. ! -----------------
  2171.   
  2172. ***************
  2173. *** 42,44 ****
  2174.       or bitftp@pucc.princeton.edu, and the servers will send you
  2175. !     instructions on how to make requests
  2176.   
  2177. --- 43,47 ----
  2178.       or bitftp@pucc.princeton.edu, and the servers will send you
  2179. !     instructions on how to make requests.  (The bitftp service is no
  2180. !     longer available through UUCP gateways due to complaints about
  2181. !     overuse :-( )
  2182.   
  2183. ***************
  2184. *** 804,807 ****
  2185.   10K - 60K).  An older MOD format only allowed for up to 15 samples in
  2186. ! a MOD file; you don't see many of these anymore.  [The standard
  2187. ! sampling rate is 10k, see below. --GvR]
  2188.   
  2189. --- 807,810 ----
  2190.   10K - 60K).  An older MOD format only allowed for up to 15 samples in
  2191. ! a MOD file; you don't see many of these anymore.  There is no standard
  2192. ! sampling rate for these samples.  [But see below.]
  2193.   
  2194. ***************
  2195. *** 982,1001 ****
  2196.   
  2197. ! The MOD sampling rate
  2198. ! ---------------------
  2199. ! From dgc3@midway.uchicago.edu:
  2200. ! The standard rate is 10k exactly.  Instrument files should be 10k,
  2201. ! signed, 8-bit raw audio.  A lot of people ask how to create MOD
  2202. ! samples on their own machine; the answer is:
  2203. ! [%>] sox mysound.foo -r10000 -sb sample.sam
  2204. ! I quite doubt that there are any deviations here, since the sample
  2205. ! data is incorporated into the MOD file and cannot store its own format
  2206. ! header.  The Amiga program MED uses a custom format for its MODs
  2207. ! (often called MEDs because of name similarity), and does allow any
  2208. ! 8SVX sample of any sampling rate to be used.
  2209. ! David
  2210.   
  2211. --- 985,988 ----
  2212.   
  2213. ! PS: A file with even *much* more info on MOD files, compiled by Lars
  2214. ! Hamre, is available from ftp.cwi.nl:/pub/audio/MOD-info.  Enjoy!
  2215.   
  2216.  
  2217.